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"Procedimento per tradurre istruzioni per tin processore 
di tipo ARM in istruzioni per un processore di tipo LX, 
relativo dispositivo di traduzione e prodotto 
informatico" 
5 * * * 

Campo dell ' invenzione 

La presente invenzione si riferisce alle tecniche 
per la traduzione delle istruzioni destinate a operare 
su processori diversi . L' invenzione e stata messa a 

10 punto con particolare riferimento alia possibile 
applicazione alia traduzione di istruzioni eseguibili 
su un processore di tipo ARM in istruzioni eseguibili 
su un processore di tipo LX, quale ad esempio il 
microprocessore ST2 00-LX di produzione della 

15 Richiedente. 

Descrizione della tecnica nota 

Un microprocessore ARM d tipicamente un 
microprocessore scalare pipelined a 32 bits, cioe un 
microprocessore la cui architettura interna e 

20 costituita da diversi stage logici, ognuno dei quali 
contiene una istruzione in un ben specif ico stato. 
Detto stato pud essere di: caricamento della istruzione 
stessa dalla memoria, di decodifica, di indirizzamento 
di un file di registri, di esecuzione, di 

25 scrittura/lettura dati dalla memoria. II numero di bit 
si riferisce all'ampiezza dei dati e delle istruzioni 
sui quali opera. Le istruzioni sono generate in uno 
specifico ordine mediante compilazione e eseguite nello 
stesso. Un microprocessore LX e tipicamente un 

30 microprocessore del tipo definito Very Long Instruction 
Word o WLIW, pipelined a 128 bits. Un microprocessore 
superscalare pipelined possiede un' architettura interna 
costituita da diversi stage logici alcuni dei quali 
possono eseguire istruzioni in parallelo, ad esempio 

35 nella fase di esecuzione. Tipicamente il parallelismo e 



2 



di 4 istruzioni a 32 bits ciascuna (eguale a 128 bits) 
mentre i dati sono espressi in 32 bits. 

II processore si dice superscalare se le istruzioni 
sono riordinate dinamicamente in fase di esecuzione in 
5 modo da alimentare gli stage di esecuzione che 
potenzialmente possono lavorare in parallelo e se le 
istruzioni non presentano dipendenze mutue, alterando 
cosi l'ordine generato stat icamente dalla compilazione 
del codice sorgente. 

10 II processore si dice VLIW se invece le istruzioni 

sono riordinate staticamente in fase di compilazione ed 
eseguite in quell 1 ordine fisso, non modif icabile in 
fase di esecuzione. 

Per maggiori inf ormazioni circa la architettura dei 

15 microprocessor! si pud fare riferimento alia 
descrizione riportata nel testo: Computer Organization 
& Design The hardware/ software interface, DA. Patterson 
Sc J.L. Hennessy, Morgan Kaufmann. 

II processore ARM d una macchina RISC single- issue 

20 dotata comunque di un set di modi di indirizzamento 
suf f icientemente ampio (le istruzioni di data- 
processing supportano ben nove modalita diverse) e 
presenta la possibility di eseguire condizionalmente la 
quasi totalita delle sue istruzioni sulla base dei flag 

25 contenuti nel regis tro di stato denominato CPSR. 

II processore LX e un processore VLIW four- issue, 
che nel seguito della presente descrizione sara sempre 
illustrato nella versione single-cluster. 11 processore 
LX a differenza del processore ARM ha soltanto due modi 

30 di indirizzamento (immediato e da registro) e non 
consente 1' esecuzione condizionata , ma data la presenza 
di quattro lane operanti in parallelo permette di 
eseguire in parallelo piu alternative (con un massimo 
di 4 istruzioni) per poi effettuare la scelta del 

35 risultato opportuno una volta valutata la condizione 



sull ' esecuzione . 

II microprocessore ARM nella vers i one 5 cui si fara 
riferimento nel seguito, possiede un • architet tura 
interna a 32 bit che garantisce uno spazio di 
5 indirizzamento di 4 Gbyte e presenta 31 registri di uso 
generale, dei quali pero* solo 16, indicati con i 
riferimenti da Rl a R16, sono accessibili 
contemporaneamente . 

Esistono infatti sette differenti modi di 
10 funzionamento necessari per gestire le varie tipologie 
di eccezioni a cui il processore deve rispondere: 

USER modo di esecuzione normal e 

FIQ gestione di interrupt ad alta 

velocita 

15 IRW gestione di interrupt di tipo 

generico 

SUPERVISOR modo privilegiato per il sistema 
opera tivo 

ABORT protezione dell'accesso alia memoria e/o 

20 memoria virtuale 

UNDEFINED codice di operazione non definito, 

per l'emulazione di coprocessore 

SYSTEM modal ita privilegiata per 

operazioni particolari del sistema operative 
25 Due dei 16 registri accessibili hanno un ruolo 

particolare : 

il registro R15 e" utilizzato come program 
counter (PC) ciod contiene l'indirizzo 
dell ' istruzione da eseguire; 

30 - il registro R14 e utilizzato come link-register 

(LR) ; contiene cioe l'indirizzo dell ' istruzione 
da eseguire a seguito del ritorno 
dall 1 esecuzione di una subroutine. 
Normalmente, inoltre, il registro R13 e utilizzato 

35 dal software come stack pointer. 



Due o piu del registri di uso generals sono 
replicati per i vari modi di funzionamento al fine di 
velocizzare la gestione delle eccezioni . 

Nei modi IRQ, Abort, Undefined e Supervisor 
rispetto al modo User sono replicati solo i registri 
R13 e R14 (owero link-register e stack-pointer) . 

Nel modo FIQ, per rendere ancora piu veloce la 
gestione dell'eccezione sono stati replicati anche i 
registri da R8 a R12 . 

II modo System, pur avendo tutti i benefici di un 
modo privilegiato, vede tutti gli stessi registri del 
modo User. 

Owiamente il program counter non e" replicato in 
nessuno dei modi . 

Oltre ai registri di uso generale d disponibile un 
registro di stato CPSR, il cui contenuto e mostrato in 
Tabella 1 contenente informazioni sul risultato 
dell ' esecuzione e sul modo di funzionamento. 
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Tabella 1 
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- N flag (negative flag) : N=l se il 
risultato di una operazione e negativo; 

- C flag (carry flag) : C=l se il risultato 
di una operazione di somma genera riporto 
oppure se durante la fase di generazione 
degli operandi per un ' operazione logica si 
sono verificate particolari condizioni, C=0 
se il risultato di un ' operazione di 
sottrazione genera riporto (borrow) ; 

V flag (overflow flag) : V=l se una 
operazione aritmetica ha generato overflow 

Z flag (zero flag) : Z=l se il risultato 
di un' operazione d zero; 
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Q flag : nelle versioni Extended Q=l se 
il risultato di una delle operazioni del gruppo 
Enhanced DSP genera overflow o saturazione. 
I bit dal 26 all' 8 non devono essere modif icati e 
5 sono letti come zero. 

I bit: se I =1 disabilita gli interrupt IRQ; 
F bit: se F=l disabilita gli interrupt FIQ; 
T bit: se T=0 il processore sta eseguendo nella 
normale modalita ARM, se T=l e attiva la 
10 modalita di esecuzione Thumb. In questa modalita 

ARM interpreta un set di istruzioni ridotto, con 
codici operazione o opcode che occupano solo 16 
bit ma con aritmetica e registri a 32 bit, e 
vede contemporaneamente solo 8 registri di uso 
15 general e. 

I 5 bit meno signif icativi del registro di stato 
descrivono il modo di funzionamento del processore ARM, 
come si pud vedere dalla segueht e Tabella 2: 



CPSR (4:0) 


MODO 


OblOOOO 


USER 


OblOOOl 


FIQ 


OblOOlO 


IRQ 


OblOOll 


SUPERVISOR 


OblOlll 


ABORT 


ObllOll 


UNDEFINED 


Oblllll 


SYSTEM 



Tabella 2 



20 Tutti i modi privilegiati , oltre al registro CPSR, 

presentano poi un registro SPSR, replicato per ogni 
modo. II registro SPSR associato ad un certo modo viene 
utilizzato per salvare la parola di stato contenuta nel 
registro CPSR quando viene sollevata l'eccezione 

25 corrispondente a quel modo; alia fine della gestione 
dell ' eccezione il registro CPSR verra ripristinato con 



il valore del registro SPSR. Le istruzioni del 
processore ARM possono essere classificate in sei 
gruppi : 

data-processing (modo di indirizzamento 1) ; 
load & store di word (32 bit) o unsigned byte 
(modo di indirizzamento 2) ; 

load & store di half word (16 bit) o signed byte 
(modo di indirizzamento 3); 

load & store multiple (modo di indirizzamento 4) 
istruzioni per i coprocessori (modo di 
indirizzamento 5) ; 
salti. 

II processore ARM consente l'esecuzione 
condizionata di quasi tutte le sue istruzioni sulla 
base dei flag N, C,V,Z contenuti nel registro di stato 
CPSR. 

La condizione e descritta nei quattro bit piu 
signif icativi dell'opcode del processore ARM. 

Fanno eccezipne 1 ' istruzione BLX (branch, link and 
exchange to Thumb state) e le istruzioni che fanno 
riferimento ai coprocessori, che non sono condizionali . 

Le varie combinazioni dei flag generano sedici tipi 
di esecuzione condizionata: 

AL (always): 1 ' istruzione viene sempre eseguita; 

NV (never: 1' istruzione non viene mai eseguita, 

non e definita opppure fa parte delle istruzioni 

non condizionali alle quali si e accennato in 

precedenza ; 

EQ (equal) : Z=l; 

NE (not equal) : Z = 0; 

CS/HS (carry set - unsigned higher or same) : 
C=l; 

CC/LO (carry clear - unsigned lower) : C=0; 

MI (minus - negative) : N=l; 

PL (plus - positive or zero) : N=0; 



VS (overflow) : V-l; 
VC (no overflow) : V=0; 
HI (unsigned higher) : C=l e Z = 0; 
LS (unsigned lower or same) : C=0 o Z=l ; 
GE (unsigned greater than or equal) : N=V; 
LT (signed less than) : N != V; 
GT (signed greater than) : Z=0 e N=V; 
LE (signed less than or equal) : Z=l o N!=V. 
Le modal ita di indirizzamento del processore ARM 
per le istruzioni di data -processing sono undici : 
Immediato; 

diretto da registro; 

shift logico a sinistra da registro (l'entita 

dello shift e contenuta in un registro) ; 

shift logico a sinistra da immediato (l'entita 

dello shift e espressa da un immediato a 5 bit 

contenuto nell ' opcode) ; 

shift logico a destra da registro; 

shift logico a destra da immediato; 

shift aritmetico a destra da registro; 

shift aritmetico a destra da immediato; 

rotazione a destra da registro; 

rotazione a destra da immediato; 

rotazione attraverso il carry flag. 
Le istruzioni di data-processing sono operazioni di 
tipo logico o aritmetico che vengono eseguite 
dall'unita aritmetico logica o ALU a 32 bit del 
processore ARM. 

Queste operazioni possono modificare il valore dei 
flag del registro CPSR sulla base del loro risultato 
quando il bit 20 (S bit) dell' opcode e a valore alto. 
La fase di esecuzione di queste operazioni dura sempre 
un solo ciclo di clock. 

II processore ARM e" poi in grado di eseguire 
moltiplicazioni e moltiplicazioni con accumulo di 



numeri fino a 32 bit, generando un risultato a 64 bit 
che viene spezzato in due registri destinazione . 

Tutte le operazioni di moltiplicazione supportano 
solo 1 ' indirizzamento diretto da registro e la loro 
fase di esecuzione dura un solo ciclo di clock, 
indipendentemente dalla necessita o meno di effettuare 
1'operazione di accumulo alia fine della 
moltiplicazione stessa. 

Le operazioni di load & store in memoria del raodo 2 
agiscono su word e unsigned byte e supportano nove modi 
di indirizzamento, che fanno comunque uso di un 
registro base e di uno spiazzamento : 

registro base +/- immediato a 12 bit; 
registro base +/- registro offset; 
registro base +/- registro offset scalato (il 
registro offset e shiftato con modalita analoghe 
alie istruzioni di data-processing; l'entita 
dello shift e" descritta da un immediato; 
registro base +/- immediato pre-indexed (il 
registro base viene aggiornato prima di 
effettuare l'accesso a memoria); 
registro base +/- registro offset pre-indexed; 
registro base +/- registro scalato pre-indexed; 
registro base +/- immediato post- indexed (il 
registro base viene aggiornato dopo avere 
effettuato l'accesso a memoria); 

registro base +/- registro offset post-indexed; 
registro base +/- registro scalato post-indexed. 
L'operazione di lettura dalla memoria di una parola 
a 32 bit non necessita che l'indirizzo sia di per se 
word-aligned; la lettura viene effettuata comunque, 
dopo di che la parola o word viene ruotata di 8,16 o 24 
se l'indirizzo non era word-aligned ma terminava per 
ObOl, OblO o Obll. 

L'operazione di scrittura di una word invece si 



autoallinea ignorando completamente i due bit meno 
signif icativi dell ' indirizzo, quindi non d esattamente 
il duale dell ' operazione di lettura. 

Le operazioni di load & store in memoria del modo 3 
agiscono su half word e signed byte e supportano solo 
sei dei nove modi di indirizzamento associati al modo 
2 : 

registro base +/- immediato a 8 bit; 
registro base +/- registro offset; 
registro base +/- immediato pre-indexed; 
registro base +/- registro offset pre-indexed; 
registro base +/- immediato post- indexed; 
registro base +/- registro offset post -indexed. 
Al contrario di quanto accade per le istruzioni del 
modo 2, le operazioni di lettura e scrittura su 
half word (16 bit) necessitano di indirizzi half word- 
aligned per essere eseguite correttamente . 

Le operazioni di load & store multiple del modo 4 
contengono all 'interne del loro opcode un campo di 16 
bit che marca con un bit a livello alto i registri 
interessati al trasf erimento . 

Queste operazioni presentano quattro modi di 
indirizzamento: 

increment after: la lista di registri e caricata 
in memoria (per le store) o dalla memoria (per 
le operazioni di load) a partire dall ' indirizzo 
puntato da un registro base. I registri 
successivi verranno caricati in indirizzi 
ottenuti incrementando di quattro (dato che 
l'accesso d a word) 1' indirizzo dell'accesso 
precedente ; 

increment before: 1' indirizzo base viene prima 
incrementato di quattro e poi utilizzato per il 
primo accesso. I registri successivi verranno 
caricati in indirizzi ottenuti dal precedente 



per incremento; 

decrement after: come increment after, ma 
I'indirizzo successivo e ottenuto per decremento 
decrement before: come increment before, ma gli 
indirizzi sono ottenuti per decremento. 
II registro base pud opzionalmente essere 
aggiornato alia fine dell ' operazione con il valore 
della successiva locazione puntata se il bit 21 (W bit) 
dell 'opcode d a livello alto. 

Esistono inoltre istruzioni di load & store 
multiple eseguibili solo in modo di funzionamento 
privilegiato che consentono di caricare dalla memoria 
il program counter o di accedere ai registri di uso 
generale del modo User. 

II processore ARM prevede poi altre due istruzioni 
che accedono alia memoria: 
SWP: swap word; 
SWPB: swap byte. 
Queste istruzioni effettuano ciascuna due accessi a 
memoria, caricando in un primo registro il contenuto di 
una locazione di memoria puntata da un registro base e 
scrivendo nella stessa locazione di memoria il 
contenuto di un secondo registro. Se il primo e il 
secondo registro coincidono, si sono scambiati i 
contenuti del registro e della locazione di memoria. 

Le operazioni sui coprocessor! del modo 5 
comprendono : 

load from memory to coprocessor ; 
store from coprocessor to memory; 

move from general purpose register to 
coprocessor's register; 

move from coprocessor's register to general 
purpose register; 

execute coprocessor's data-processing operation. 
Le istruzioni per i coprocessori non sono qui 



descritte.il processore ARM prevede poi tre istruzioni 
di salto: 

salto condizionato PC-relative (con e senza 
memoria dell ' indirizzo di ritbrno) : l'offset di 
24 bit e contenuto nell' opcode del salto. Per 
calcolare 1' indirizzo di destinazione esso viene 
moltipllcato per quattro {in quanto ogni opcode 
del microprocessore ARM occupa 32 bit) ed esteso 
con segno, per poi essere sommato al valore 
attuale del program counter. E opportuno 
sottolineare che, in conseguenza 

dell'architettura della pipeline del processore 
ARM, al moment o dell 1 aggi ornament o che awiene 
nella fase di esecuzione, il program counter 
contiene 1' indirizzo dell ' istruzione di salto 
incrementato di otto; 

salto incondizionato con cambiamento di modo: il 
processore effettua un salto con offset di 24 
bit, mantiene memoria dell ' indirizzo di ritorno 
nel link register ed entra in modo Thumb, 
modificando il T bit della parola di stato; 
salto condizionato con cambiamento di modo (con 
o senza memoria dell ' indirizzo di ritorno): il 
processore effettua un salto all ' indirizzo 
contenuto in un registro indice. II valore del 
registro indice viene allineato trascurandone il 
bit meno significative, che viene utilizzato per 
decidere il modo di f unzionamento (se a livello 
alto modo Thumb, altrimenti modo ARM) . 
Occorre sottolineare che, a differenza del 
processore LX, per il processore ARM il program counter 
fa parte dei registri di uso generale, quindi qualsiasi 
operazione di data-processing o di load dalla memoria 
che abbia R15 come registro destinazione pud generare 
un salto. 
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La fase di commitment delle operazioni che hanno il 
program counter come destinazione e percio diversa 
dalle normali istruzioni di load o data-processing e 
deve prevedere il ripristino del registo CPSR con il 
valore contenuto nel registro SPSR associato al modo 
corrente . 

Due istruzioni speciali si occupano della 
manipolazione dei registri di stato : 

MSR: muove un immediato o un registro di uso 

generale del modo corrente in uno dei registri 

di stato del modo corrente (CPSR o SPSR) ; 

MRS: muove un registro di stato del modo 

corrente in un registro di uso generale del modo 

corrente. 

Queste istruzioni sono eseguibili correttamente 
solo in un modo di esecuzione privilegiato e non devono 
essere usate per modificare il T bit del registro CPSR, 
il che causerebbe una trans izione da modo ARM a modo 
Thumb o viceversa. 

Accedere al registro SPSR nel modo System, che non 
vede questo registro, ha un effetto imprevedibile 
sull ' esecuzione . 

Viene ora descritta 1 ' architettura del 
microprocessore LX. 

Il processore LX e un nucleo o core con possibility 
di assumere diverse conf igurazioni a seconda 
dell ' impiego; nel seguito si fara riferimento alia 
versione single-cluster 4 -issue. 

L' architettura intera e a 32 bit e presenta 64 
registri di uso generale piu un program counter non 
accessibile direttamente dall'utente. 

Due dei registri di uso generale hanno pero' 
funzioni particolari : 

il registro R63 e usato come link register; 

il registro RO contiene sempre il valore zero ed 
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e utilizzato per confronti ed assegnamenti che 
non possono usare esplicitamente un'ulteriore 
campo immediato, come sara chiarito nel seguito. 
Esistono poi una serie di registri speciali (sempre 
a 32 bit) mappati in un'area riservata che occupa gli 
ultimi 4 Kbyte dello spazio di indirizzamento del 
processore LX, che e di 4 Gbyte. 

Questi registri comprendono tra l'altro: 

un registro di stato PSW che contiene il modo di 
funzionamento (User o Supervisor) ed 
inf ormazioni sui dispositivi per la protezione e 
la gestione del la memoria ; 

un registro di stack per il registro di stato, 
utilizzato in presenza di eccezioni; 
un registro di HANDLER_PC, utilizzato in 
presenza di eccezioni per contenere l'indirizzo 
dell ' except ion -handier; 

altri registri che contengono inf ormazioni 
funzionali al riconoscimento ed alia gestione 
delle eccezioni; 

registri per il controllo delle unita di 
protezione per la memoria programmi (IPU) e dati 
(DPU) . 

In ogni cluster del processore LX vi sono quindi 
quattro lane, ad ognuna delle quali e associata una ALU 
in grado di eseguire le normal i operazioni-logico 
aritmetiche a 32 bit. Vi sono poi due unita in grado di 
effettuare le moltiplicazioni di un numero a 16 bit con 
uno a 32, con risultato troncato a 32 bit. Queste unita 
sono associate alle lanes 1 e 3 del cluster. 

II processore LX consente un solo accesso a memoria 
per ogni cluster, quindi esiste un'unica Load&Store 
unit, che pud eseguire operazioni su word, half word o 
byte e che pud essere associata ad una qualsiasi delle 
lanes del cluster. 
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Un'unita denominata Instruction Issue Unit alloca 
le operazioni contenute in uno stesso bundle o insieme 
di istruzioni sulle lanes in modo tale che i due bit 
meno signif icat ivi dell ' indirizzo di word di ogni 
istruzione determinino la lane sulla quale 1 1 istruzione 
stessa e lanciata in esecuzione. 

Una diretta conseguenza di questo e che 
un ' istruzione di moltiplicazione , che deve essere 
eseguita su una lane dispari, deve occupare 
un' indirizzo di word dispari nella memoriaprogrammi . 
Occorre quindi realizzare 1 ' al lineament o inserendo nel 
codice, se necessario, delle istruzioni NOP (no 
operation) . 

In ogni cluster e presente poi un'unita denominata 
branch unit che esegue le operazioni di salto. II 
processore LX realizza le operazioni di salto 
condizionato sulla base di uno dei branch-bit register, 
un gruppo di otto registri da un bit ciascuno che 
contengono il risultato di operazioni logiche o di 
conf ronto . 

II valore di un branch-bit register deve essere 
assegnato almeno due bundle prima che awenga il salto 
condizionato corrispondente . 

Tutte le operazioni di salto devono occupare la 
prima istruzione del bundle e non possono esservi due 
istruzioni di salto all'interno dello stesso bundle, 
nemmeno se i due costrutti sono alternativi. 

Il processore LX ha due sole modal it a- di 
indirizzamento per le istruzioni di data-processing: 
da registro; 
da immediato . 

Gli immediati possono pero' essere di due tipi .- 
short e long. 

Gli immediati short sono numeri con segno su 9 bit, 
in grado di rappresentare un numero da -128 a +128 e 



sono incorporati nei 32 bit dell ' opcode . 

Gli immediati long sono numeri con segno a 32 bit e 
occupano con i 9 bit meno signif icat ivi parte dei 32 
bit dell 'opcode. I rimanenti 23 bit sono contenuti in 
5 una delle word adiacenti all 'opcode, con il vincolo di 
essere associati alle lane 0 o 2 del cluster e quindi 
di occupare un indirizzo di word pari. 

Le operazioni di accesso alia memoria consentono 
solo 1 'indirizzamento mediante registro base piu offset 

10 a 9 bit e, al contrario di quanto accade per il 
processore ARM, necessitano 1 ' allineamento . 

Accessi a word su indirizzi che non siano word- 
aligned, cosi come accessi ad half word non half word- 
aligned generano eccezioni . 

15 Per quanto riguarda le istruzioni di salto, alle 

quali gia si e accennato in precedenza, vi sono 
operazioni di salto condizionato (BR, BRF) , che 
ef fettuano salti ad offset (23 bit) e istruzioni di 
salto incondizionato (CALL, GOTO, RTI) che possono 

20 effettuare salti ad offset (23 bit) oppure salti 
all ' indirizzo puntato dal link-register, con il vincolo 
che il link-register deve essere modificato almeno tre 
bundle prima del salto corrispondente . 

Vi sono poi due istruzioni (SLCT, SLCTF) che 

25 consentono di operare una operazione MOV condizionale 
sulla base della valutazione di un branch-bit: se 
questo ha livello alto viene portato nel registro 
destinazione il primo registro sorgente, in caso 
contrario viene caricato il secondo registro sorgente o 

30 un immediato a seconds della modalita di 
indirizzamento . 

Occorre sottolineare infine che il processore LX, 
al contrario del processore ARM, non contiene un 
registro dei flag, e che quindi non e in grado di 

35 evidenziare automat icamente se le operazioni 
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aritmetiche generino carry o overflow. 

Sono gia note nella tecnica varie soluzioni che 
mirano a consent ire ad un dato microprocessore di 
eseguire istruzioni di un set originariamente destinato 
ad un processore diverse 

Ad esempio, la domanda di brevetto europeo EP-A-0 
74 7 808 descrive un processore a doppio set di 
istruzioni in grado di interpretare sia il codice 
nativo di un elaboratore IBM PowerPC sia il codice per 
la famiglia di processori x86 di Intel. 

Detto documento descrive la gestione del sistema di 
memoria virtuale necessario a consentire il 
multitasking di due applicazioni sviluppate per set di 
istruzioni diversi, ma non descrive un processo di 
traduzione. 

Per effettuare una traduzione efficiente delle 
istruzioni x86, la struttura originaria del PowerPC 
viene estesa con istruzioni e registri dedicati 
all' esecuzione in modalita x86. 

La issue- logic del core viene inoltre modificata 
aggiungendo delle unita di decodifica e traduzione di 
opcode x86. Queste unita lavorano in parallelo 
all 'unita di decodifica nativa del PowerPC ed in base 
a 1 modo di lavoro corrente viene scelta quale delle due 
decodifiche applicare. Per consentire di determinare il 
modo di lavoro del processore viene aggiunta una Mode 
Control Unit responsabile di gestire la commutazione 
tra il modo x86 ed il modo PowerPC. 

Quest' unita d in grado di interagire con la Memory- 
Management Unit per consentire una corretta gestione 
del sistema di memoria virtuale. 

Scopi e sintesi della presente invenzione 

Analizzando i due set di istruzioni del processore 
ARM e LX emerge come solo una minima parte delle 
istruzioni del microprocessore ARM ha corrispondenza 
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con una singola istruzione del microprocessore LX, a 
causa della possibility di esecuzione condizionale, 
della varieta dei modi di indirizzamento del processore 
ARM, delle diverse modalita di accesso a memoria e 
5 della mancanza su LX di un registro di stato. Una tale 
espansione del codice del processore ARM nella fase di 
traduzione ha un immediato riflesso sulla possibility 
di emulare il comport amen to di un processore ARM sul 
microprocessore LX e sulla possibile realizzazione di 

10 un dispositivo che effettua la traduzione. 

La presente invenzione si prefigge pertanto lo 
scopo di fornire una soluzione che permetta di 
realizzare la traduzione delle istruzioni eseguibili su 
un processore di tipo ARM in istruzioni eseguibili su 

15 un processore di tipo LX. 

Secondo la presente invenzione, tale scopo viene 
raggiunto grazie a un procedimento avente le 
caratteristiche richiamate in modo specifico nelle 
rivendicazioni che seguono, che formano parte 

20 integrant e della presente descrizione. 

L' invenzione riguarda anche il corrispondente 
dispositivo di traduzione, nonch6 il corrispondente 
prodotto informatico direttamente caricabile nella 
memoria di un elaboratore numerico quale un processore 

25 e comprendente porzioni di codice software per attuare 
il procedimento secondo 1' invenzione quando il prodotto 
e eseguito su un elaboratore . 

La soluzione secondo 1' invenzione, messa a punto 
con specifico riferimento alia traduzione di istruzioni 

30 ARM in istruzioni LX, e in realta applicabile ad un 
carapo di impiego piu ampio, ossia alia traduzione delle 
istruzioni di un microprocessore scalare pipelined 
avente caratteristiche comunque riconducibili alle 
caratteristiche di un processore ARM verso un 

35 microprocessore del tipo VLIW avente caratteristiche 
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comunque riconducibili alle caratteristiche di un 
processore LX. 

Questo concetto e stato espresso nel seguito, ed in 
particolare nelle rivendicazioni annesse, facendo 
riferimento rispettivamente a processori "di tipo ARM" 
e di "tipo LX" . I 

In sostanza, la soluzione secondo l'invenzione 
prevede di raappare ogni registro del microprocessore 
ARM su un registro del microprocessore LX at to a 
emularne il comportamento, realizzando la traduzione in 
assenza di accesso diretto alle risorse del nucleo o 
core di detto microprocessore LX. 

Breve descrizione dei disegni annessi 

L' invenzione verra ora descritta a puro titolo di 
esempio, non limitative con riferimento ai disegni 
annessi, comprendenti un'unica figura che riproduce uno 
schema a blocchi di un dispositivo di traduzione 
operante secondo l'invenzione. 

Descrizione di esempi preferiti di attuazione 
dell ' invenzione 

I principi fondamentali della tecnica di traduzione 
qui descritta, corrispondente alia forma di attuazione 
dell ' invenzione al momento preferita, sono i seguenti : 
mappare ogni registro del microprocessore ARM, 
compresi i registri replicati e tutti i registri 
di stato, su un registro del microprocessore LX 
che ne emulera il comportamento; 

non modificare il core del microprocessore LX 
aggiungendo unita funzionali per coprire parte 
del set di istruzioni o delle modalita. di 
indirizzamento del microprocessore ARM 
attualmente non coperte dal microprocessore LX; 
avere una traduzione univoca delle istruzioni 
del microprocessore ARM, che non sia data- 
dependent ; 



19 



non accedere mai direttamente alle risorse del 
core del microprocessore LX prima o durante la 
fase di traduzione. 
In particolare, la soluzione secondo 1 ' invenzione , 
5 nella sua forma di attuazione al momento preferita si 
distingue rispetto alle impostazioni note per diversi 
motivi : 

il core del microprocessore LX non viene in 
alcun modo modificato per interpretare il codice del 
10 microprocessore ARM, ma viene aggiunto un 

dispositivo traduttore esterno, posto tra detto core 
e la cache; 

il dispositivo traduttore, quando necessita 
di accedere alle risorse del core del 

15 microprocessore LX, non lo accede direttamente, ma 

incorpora nella traduzione dell ' istruzione ARM dei 
costrutti condizionali basati sul contenuto dei 
registri o dei branch bit del core del 
microprocessore LX (si veda ad esempio nel seguito 

20 della descrizione il metodo con cui si determina il 

modo corrente di lavoro del processore ARM per le 
istruzioni MRS e MSR) ; 

il dispositivo traduttore entra in azione 
autonomamente , riconoscendo gli accessi alia zona di 

25 memoria riservata al codice ARM, senza bisogno di 

operazioni di commutazione o switch esplicite e di 
una Mode Control Unit; 

le istruzioni ARM vengono tradotte in 
istruzioni LX che vanno poi decodif icate dalla 

30 issue-logic del microprocessore LX, la quale viene 

mantenuta inalterata. Al contrario, nel documento 
EP-A-707 848 sopracitato le istruzioni x86 vengono 
decodificate per controllare direttamente le risorse 
del core . 

35 Mappando fisicamente tutti i registri del 



processore ARM, compresi i registri replicati e i 
registri di stato, sui registri del processore LX, 
viene poi emulate anche il comport araento del program 
counter del processore ARM. 



5 L'operazione di mappatura dei registri ARM e degli 
altri registri funzionali alia traduzione sui registri 
LX e descritta nella tabella 3 qui riprodotta . 



RO : always zero 


R32 : ARM R13spv 


Rl : Rtemp 1 (temporary storage) 


R33 : ARM R14spv 


R2 : Rtemp 2 (temporary storage) 


R34: ARM 13irq 


R3 : Rtemp3 (temporary storage) 


R35: ARM R13irq 


R4 : Rtemp4 (temporary storage) 


R3 6: ARM R13abt 


R5 : Rtemp5 (temporary storage) 


R37: ARM R13abt 


R6 : Rtemp6 (temporary storage) 


R3S: ARM R13und 


R7 : Rtemp7 ( (temporary storage) 


R3 9: ARM R13und 


R8 : Rtemp8 (temporary storage) 


R40: ARM R8stack 


R9:Rt dest (temporary destination) 


R41: ARM R9stack 


RIO : Rshif t op (2nd operand) 


R42: ARM RIOstack 


Rll : RN (negative flag) 


R43 : ARM Rllstack 


R12 : LX stack-pointer 


R44 : ARM R12stack 


R13 : RC (carry flag) 


R45: ARM R13stack 


R14 : RV (overflow flag) 


R46: ARM R14stack 


R15: RZ (zero flag) 


R47 : not used 


R16: ARM RO 


R48: ARM CPSR (status register) 


R17: ARM Rl 


R49: ARM SPSRspv (status register) 


R18: ARM R2 


R50: ARM SPSRirq , ( status register) 


R19: ARM R3 


R51: ARM SPSRfiq (status register) 


R2 0: ARM R4 


R52: ARM SPSRund (status register) 


R21: ARM R5 


R53: ARM SPSRabt (status register) 


R22: ARM R6 


R54: ARM R13fiq 


R23 : ARM R7 


R55: ARM RI3fiq 


R24: ARM R8 


R56: RtN (temporary negative flag) 


R25: ARM R9 


R57: RtZ (temporary zero flag) 


R26: ARM RIO 


R58: RtC (temporary carry flag) 



R27: ARM Rll 


R59: RtV (temporary overflow flag) 


R2 8: ARM R12 


R60 : not used 


R29: ARM R13 (stack-pointer) 


R61 : not used 


R30: ARM R14 (link-register) 


R62 : not used 


R31: ARM R15/ ARM PC 


R63 : LX link-register 



Tabella 3 



Con PC si indica il program counter del processore 

LX. 

Per garantire la corretta esecuzione di un 
5 programma per microprocessore ARM su un microprocessore 
LX, una prima soluzione proposta e quella di forzare il 
program counter del microprocesseor LX a emulare il 
f unzionamento del program counter del microprocessore 
ARM. 

10 Seguendo questo approccio, all'atto del caricamento 

di una istruzione ARM il program counter del processore 
LX deve contenere esattamente lo stesso valore del 
program counter del processore ARM, ma il processore LX 
si trova nella grande maggioranza dei casi a dover 

15 eseguire piu di una istruzione per emulare il 
comportamento del processore ARM, cosicche" al termine 
dell ' esecuzione dell ' istruzione emulata sara necessario 
un salto all ' indirizzo della prossima istruzione ARM, 
per poter caricare 1 ' istruzione successiva. 

20 Nel frattempo, un ulteriore registro ARM_R15/ARM_PC 

che emula il program counter del processore ARM, 
indicato in Tabella 3, dovra essere prima incrementato 
di otto in modo che ogni istruzione che vi acceda 
durante la sua fase di esecuzione abbia un 

25 comportamento coerente con 1' esecuzione sulla pipeline 
del processore ARM, e poi decrement ato di quattro per 
puntare alia successiva istruzione ARM in memoria. 

Fanno eccezione naturalmente le istruzioni ARM che 
hanno come registro destinazione il program counter, 

30 per le quali il caricamento della successiva istruzione 
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ARM awerra caricando nel link- register del processore 
LX il valore aggiornato del registro ARM_PC ed 
effettuando un salto incondizionato del tipo GOTO link. 
Per realizzare quanto descritto precedentemente , la 
5 traduzione delle istruzioni ARM e affidata ad un 
dispositivo posto esternamente al core LX, che 
intercetta gli accessi alia zona di memoria riservata 
al codice ARM, traducendo tutte le istruzioni che non 
hanno una singola istruzione LX equivalente in un salto 
10 incondizionato di tipo GOTO e forzando il program 
counter del processore LX a puntare ad un'area di 
memoria riservata per contenere la traduzione 
dell ' istruzione ARM che nel frattempo viene 
decodif icata . 

15 In questo buffer di traduzione il dispositivo andra 

a caricare tutti i bundle che costituiscono la 
traduzione LX dell ' istruzione ARM decodif icata . Come 
gia detto, 1' ultimo bundle del la traduzione dovra 
contenere un salto a link alia prossima istruzione ARM 

20 da eseguire . 

In questo modo, tutte le istruzioni ARM non 
direttamente mappabili su una istruzione LX necessitano 
di un salto alia zona di traduzione e di un salto a 
link per caricare la successiva istruzione ARM. Dato 

25 che per realizzare un salto a link LX necessita che il 
link-register venga modificato almeno tre bundle prima 
del salto corrispondente, l'impatto di questi due salti 
sulla durata dell ' esecuzione del programma ARM risulta 
notevole. 

30 Per questo motivo e proposta una seconda soluzione, 

che prevede di non forzare il program counter del 
processore LX a seguire il f unzionamento del program 
counter del processore ARM, in questo modo consentendo 
di risparmiare il salto alia zona di traduzione ed 

35 effettuare il salto con link finale solo se 
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l'istruzione ARM realizza dawero un salto. 

Oltre a rendere piu veloce 1' esecuzione del 
programma ARM questa seconda soluzione consente di 
risparmiare sul numero di istruzioni LX eseguite in 
5 parallelo e diminuire di conseguenza la dissipazione di 
potenza da parte del core rispetto alia soluzione 
precedentemente proposta. 

In assenza di salti, il program counter del 
processore LX viene lasciato evolvere liberamente. 

10 Mentre nella prima soluzione se il program counter 

di LX esce dallo spazio di memoria nel quale risiedono 
le istruzioni ARM si e sicuri di eseguire istruzioni 
native LX, nella seconda soluzione il dispositivo 
traduttore deve intercettare tutti gli access! del core 

15 alia memoria istruzioni e controllare il registro 
puntatore per decidere se eseguire le prossime 
istruzioni come native LX o come ARM da emulare. Il 
registro puntatore risiede nel dispositivo traduttore 
mostrato in figura 1, che e posto tra instruction cache 

20 e core del processore LX ed il cui f unzionamento sara 
descritto piu in dettaglio nel seguito. 

In figura 1 e mostrato dunque uno schema di 
principio del dispositivo di traduzione. Detto 
dispositivo di traduzione S indicato con 10 e comprende 

25 un buffer di traduzione 11, un sottosistema di 
traduzione 12 associato a una tabella di microcodici e 
un'unita di controllo del dispositivo 13. 

Il dispositivo di traduzione 10 e interposto fra un 
nucleo o core 14 del processore LX e una memoria cache 

30 per le istruzioni 16, che esegue la propria funzione di 
caching su due aree di memoria, una memoria RAM 17 per 
le istruzioni ARM e una memoria RAM 18 per le 
istruzioni LX. 

II dispositivo di traduzione 10 dunque, posto 

35 esternamente al core 14, intercetta gli access! dei 
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detto core 14 alia raemoria, in particolare alia zona di 
memoria riservata al codice ARM costituita dalla 
memoria RAM 17. Infatti detto dispositivo di traduzione 
10 scambia dei dati per mezzo di detta unita di 
5 controllo del dispositivo 13 con il core o nucleo 14 
del processore LX e riceve gli indirizzi su rispettive 
linee di segnale dati DI e di segnale indirizzi Al . 

L' unita di controllo del dispositivo 13 d connessa 
poi per mezzo di un bus indirizzi e dati AD alia 

10 memoria cache delle istruzioni 16, il cui puntatore d 
compreso in un insieme di registri di puntatori 
indicato con 15 e compreso nel dispositivo di 
traduzione 10. 

Nella memoria 17 e possibile osservare 

15 un' istruzione ARM da tradurre, indicata con IA, a 
titolo di esempio 1' istruzione BIC. 

Si deve osservare a questo punto che, mentre nella 
prima soluzione, che prevede di forzare il program 
counter del processore LX, se detto program counter 

20 esce dallo spazio di memoria nel quale risiedono le 
istruzioni ARM si e sicuri di eseguire istruzioni 
native LX, nella seconda soluzione il dispositivo 
traduttore 10 deve intercettare tutti gli accessi del 
core alia memoria istruzioni e controllare il registro 

25 puntatore 15 per decidere se eseguire le prossime 
istruzioni come native LX o come ARM da emulare. II 
registro puntatore 15, come sopra descritto, risiede 
nel dispositivo traduttore 10 che e posto tra la 
memoria cache 16 e core 14 del processore LX 

30 All'atto del reset del processore LX di cui fa 

parte, il dispositivo traduttore 10 e inattivo e 
rimanda gli accessi a memoria ai dispositivi 
sottostanti, tipicamente alia instruction cache 16. 
Questa e la condizione in cui dispositivo traduttore 10 

35 lavora finche il core 14 esegue un normale codice LX 
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(con istruzioni appartenenti all ' instruction set del 
processore LX) . 

Quando si verifica un accesso alia zona di memoria 
riservata a contenere il codice ARM, la memoria 17, ad 
5 esempio un accesso all ' istruzione IA, il dispositivo 
traduttore 10 si attiva, carica in un suo registro 
interno nel registro puntatori 15, indicato con 
NEXT_ARM_INS TR in fig. 1, 1 1 indirizzo a cui si accede 
ed effettua la lettura dell ' istruzione da tradurre IA 

10 in codice ARM dalla zona di memoria nella memoria 17 
corrispondente . Il registro NEXT_ARM_INSTR ha cioe 
funzione di puntatore istruzioni ARM. 

L' istruzione IA letta viene tradotta dal 
sottosistema di traduzione 12 che fa uso di una tabella 

15 di microcodice nel corrispondente insieme equivalente 
di istruzioni LX, indicato in figura 1 come traduzione 
T, e memorizzata nel buffer di traduzione 11. II 
dispositivo di traduzione 10 alloca quindi "sopra" 
all ' istruzione ARM una finestra di esecuzione alia 

20 quale saranno rimandati tutti gli accessi ad indirizzi 
di memoria che partono dal valore corrente del program 
counter del processore LX e coprono un'area pari a 
quella occupata dalla traduzione. 

II core 14 del processore LX pud quindi leggere la 

25 prima istruzione della traduzione T dal buffer 11, il 
quale la invia all'unita di controllo 13, e il 
dispositivo 10 incrementa il registro NEXT_ARM_INSTR di 
quattro per puntare alia prossima istruzione ARM della 
traduzione. In presenza di salti nel programma in 

30 codice ARM il. registro NEXT_ARM_INSTR deve essere 
riscritto esplicitamente mediante una operazione di 
store word contenuta nella traduzione LX 
dell ' istruzione ARM. 

Letta 1' ultima istruzione della traduzione T, la 

35 finestra di esecuzione si chiude e, se al successivo 
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accesso in memoria il registro NEX T_ARM_ I NS TR punta al 
di fuori del la zona di memoria riservata al codice ARM, 
il dispositivo di traduzione 10 si disattiva. 

L'unita di controllo del dispositivo 13 controlla 
5 1 ' attivazione del dispositivo di traduzione 10, attiva 
il sottosistema di traduzione nel blocco 12, per 
allocare e gestire la finestra di esecuzione mediante 
degli appositi registri puntatore interni che 
forniscono dei puntatori di finestra indicati con WP in 
10 figura 1, e a propagare gli accessi a memoria dal core 
14 verso il sistema di memoria costituito dalle memorie 
RAM 17 e 18. 

Dell'insieme di istruzioni del processore ARM non 
potranno essere tradotte quelle istruzioni la cui 
15 esecuzione dipende in modo diretto dall ' hardware delle 
periferiche o del sistema di memoria del processore ARM 
specif ico. 

Queste istruzioni comprendono: 
software interrupt; 
20 - breakpoint ; 

istruzioni per la gestione dei coprocessor! ; 
accessi a memoria con l'opzione -T: queste 
operazioni interagiscono con la memoria realizzando 
un accesso in modalita User a prescindere 
25 dall ' ef f ettivo modo corrente del processore. Il core 

ARM presenta infatti una linea che consente alia 
memoria di sapere con che attributi effettuare 
1' accesso (user o privileged). 
Viene ora descritta ora in dettaglio la procedura 
30 di traduzione delle istruzioni ARM in istruzioni LX. 

A tal scopo verra utilizzato uno pseudo-codice per 
descrivere le istruzioni. 

La descrizione in pseudo-codice della traduzione di 
ogni istruzione ARM utilizza una sintassi C-like. 
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Lie uniche estensioni alia tradizionale sintassi C 
sono le seguenti: 

- essendo il processore LX una macchina VLIW, per 
evidenziare il parallelismo a livello di istruzione 
5 ogni bundle, cioe 1 ' insieme di istruzioni LX che 

possono essere eseguite in parallelo nello stesso 
ciclo, e' stato delimitate) da una linea 
tratteggiata ; 

tutte le operazioni di assegnamento all'interno di 
10 un bundle devono considerarsi eseguite 

contemporaneamente : 1' ordine con cui le istruzioni 
sono scritte all'interno di uno stesso bundle dello 
pseudo-codice non conta e non e quello realmente 
usato sul processore LX che impone dei vincoli nel 
15 posizionamento di moltiplicazioni ed immediati 

lunghi<piu' di 9 bit); 

le variabili booleane memorizzate nei branch-bit 
register del processore LX sono indicate come $< 
nome_variabile >; 

20 - gli immediati (costanti numeriche dipendenti 
dall ' opcode della istruzione) generati direttamente 
dalla logica di traduzione in base al contenuto 
dell 'opcode ARM sono indicati nel codice eseguito da 
LX come #< nome_immediato >; 

25 - l'elenco delle operazioni svolte dal dispositivo 
traduttore per generare questi valori e descritto 
nelle caselle con bordo tratteggiato poste alia 
destra della traduzione LX; 

tutti gli opcodes LX che fanno uso di immediati 
30 lunghi occupano di fatto due word consecutive nel 

bundle LX. Nello pseudo-codice queste istruzioni non 
sono segnalate; 

l'operatore ASR (arithmethic shift right) 
simboleggia lo shift aritmetico a sinistra; 
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- l'operatore ROR (rotate right) simboleggia la 
rotazione verso destra; 

le macro 161sb_of (<register>) e 

16msb_of (<register>) indicano rispettivamente 

5 l'estrazione dei 16 bit meno signif icativi e dei 16 

piu signif icativi da un registro. I restanti 16 bit 
sono riempiti con zeri ; 

la macro Mask (<fields>) genera, sulla base della 
maschera a quattro bit <fields> contenuta 

10 nell'opcode, le maschere per la modifica dei 

registri di stato per 1' istruzione MSR; 
le operazioni di accesso a memoria sono descritte 
dalle macro: MemoryWord (<address>) , 

MemoryByte«address>) , MemoryUByte (<address>) , 

15 MemorySByte«address» . In particolare MemorySByte 

rappresenta la lettura dalla memoria ali' indirizzo 
<address> di un byte che viene esteso con segno. 
MemoryUByte rappresenta la lettura di un byte 
unsigned; 

20 - nella rappresentazione delle istruzioni, il 
carattere @ e' usato come carattere jolly. Ad 
esempio ADD© @ rappresenta tutte le istruzioni ARM 
di somma come ad esempio ADDEQ (somma se uguale) o 
ADDNE (somma se diverso) , oppureARM_R@ rappresenta 

25 uno qualsiasi dei registri LX che emulano i registri 

general -purpose del processore ARM, come ARM_R1 o 
ARM_R12 . 

Come gia descritto in precedenza, il processore ARM 
consente l'esecuzione condizionata delle istruzioni 
30 sulla base dei flag contenuti nel registro di stato 
CPSR. 

La condizione e descritta nei quattro bit piu 
signif icativi dell 'opcode ARM. 

Fanno eccezione 1 ' istruzione BLX (branch, link and 
35 exchange to Thumb state) e le istruzioni che fanno 
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riferimento ai coprocessor!, che non sono condizionali . 

La traduzione delle istruzioni per i coprocessori, 
inoltre, non e qui descritta in quanto per il loro 
corretto f unzionamento e indispensabile la presenza nel 
5 sistema basato sul core LX di dispositivi che emulino 
correttamente i coprocessori del processore ARM, qui 
non disponibili. 

Anche dal punto di vista della traduzione si 
possono suddividere le istruzioni ARM nei cinque 
10 gruppi : 

data -processing; 
moltiplicazioni ; 
load&store singole; 
load&store multiple; 
15 - salti. 

Per tutte le cinque categorie la traduzione sul 
processore LX dell ' operazione inizia con la verifica 
della condizione di esecuzione, che consiste nella 
valutazione di uno o piu dei flag presenti nel registro 
20 di stato. Quest i flag sono quattro: 

N flag (negative flag) : N=l se il risultato di una 
operazione e negativo; 

C flag (carry flag) : C e forzato a 1 se il risultato 
di una operazione logica o di una somma genera 
25 riporto, a O se il risultato di una sottrazione 

genera riporto (borrow) ; 
- V flag (overflow flag) : V=l se una operazione 
aritmetica ha generato overflow; 

Z flag (zero flag) : Z=l se il risultato di una 
30 operazione d zero. 

Le varie combinazioni di questi flag generano i 
sedici tipi di esecuzione condizionata AL, NV, EQ, NE, 
CS/HS, CC/LO, MI, PL, VS , VC, HI , LS , GE, LT, GT, LE . 
II processore LX, che non supporta 1' esecuzione 
35 condizionata, deve effettuare gli opportuni test per 



valutare se la condizione di esecuzione e verificata, 
dopo di che pud essere tradotta l'istruzione da 
eseguire . 

La valutazione positiva determina 1 ' impost azione di 
5 uno dei branch-bit del processore LX (in particolare il 
branch bit 7) , che e utilizzato per una esecuzione 
predicata dell ' istruzione o, nel caso di istruzioni che 
non possono essere eseguite in maniera speculativa come 
ad esempio le load&store, per saltare alia successiva 

10 istruzione ARM. 

Per velocizzare la modifica dei flag in base al 
risultato delle operazioni di molt iplicazione e data- 
processing, ognuno dei quattro flag C, Z, N, V e 
calcolato e memorizzato in un apposito registro del 

15 processore LX. Detti quattro registri sono indicati con 
RC, RZ, RN, RV in Tabella 3. 

Detto gruppo di registri RC, RZ, RN, RV viene letto 
per valutare la condizione di esecuzione delle 
successive istruzioni ARM. II registro ARM_CPSR sul 

20 processore LX che emula il comportamento del registro 
CPSR non viene quindi aggiornato in corrispondenza di 
ogni istruzione che lo modifica ma solamente quando si 
verifica un ' operazione di lettura su di esso, in modo 
che il valore letto sia coerente con quellp letto nella 

25 normale esecuzione dello stesso programma sul 
processore ARM. 

Nella fase di traduzione della condizione viene 
inoltre incrementato di otto il valore del registro LX 
che emula il program- counter ARM, in modo che durante 

30 le fasi successive dell ' operazione ogni accesso a tale 
registro veda il valore aggiornato, coerentemente con 
il comportamento del processore ARM. 

La traduzione delle istruzioni ARM viene descritta 
in uno pseudo-codice , la cui sintassi e dettagliata piu 

35 avanti. 



31 



Ad esempio, quando si incontra un' instruzione ARM 
con condizione di esecuzione GE (unsigned greater or 
equal), il primo bundle della traduzione LX sara: 
Istruzione ARM Traduzione LX 

@@@GE Rdest,Rsorgl, Rsorg2 $Condition = (RN==RV) 

ARM PC = ARM_PC + 8 



Quando la condizione di esecuzione e ad esempio LE 
5 (signed less or equal) e non pud essere valutata 
istantaneamente ma e necessario combinare i risultati 
dei due confront! Z=l e Ni=V, saranno necessari due 
bundle per effettuare la valutazione. 

Per le operazioni di data-processing, una volta 
10 tradotta la condizione occorre tradurre la modalita di 
indirizzamento. 

Le modalita di indirizzamento del processore ARM 
per le istruzioni di data-processing, come descritto in 
precedenza sono nove : 
15 immediato, diretto da registro, shift logico a 

sinistra da registro, shift logico a sinistra da 
immediato, shift logico a destra da registro, shift 
logico a destra da immediato, shift aritmetico a destra 
da registro, shift aritmetico a destra da immediato, 
20 rotazione a destra da registro, rotazione a destra da 
immediato, rotazione attraverso il carry flag. 

In questa fase deve essere anche valutato 1' ultimo 
bit in uscita dal registro sorgente in seguito 
all' operazione di shift. Questo bit sara utilizzato per 
25 aggiornare il valore del carry flag per quelle 
operazioni logiche che richiedono il commitment e in 
questa fase viene memorizzatoin un apposito registro 
temporaneo in attesa che in base all 'opcode si decida 
se e come deve ssere aggiornato il registro di stato 
30 CPSR. 

Nel caso di indirizzamento da immediato, occorre 
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verificare se e necessario effettuare una rotazione 
sull 1 immediato ad otto bit contenuto nel byte meno 
signif icativo dell 'opcode ARM. II campo immediato 
dell 'opcode ARM e lungo 12 bit e contiene nei quattro 
5 bit piu signif icativi un valore, indicato con amt , che 
descrive la rotazione a destra da applicare 
all' immediato ad 8 bit, indicato con imm. 

Detto valore amt a quattro bit deve essere 
moltiplicato per due per sapere di quante posizioni 

10 occorre ruotare verso destra 1' immediato. 

Se tale valore e uguale a zero non e necessaria la 
rotazione, ma occorre solamente spostare 1' immediato in 
un apposito registro temporaneo, indicato con Rshift_op 
in fig.l in modo che lasuccessiva traduzione della fase 

15 di esecuzione dell 'opcode sia univoca. II valore del 
carry flag non viene alterato da questa modality di 
indirizzamento, quindi nel registro di carry 
temporaneo, RtC in tabella 3, non si fa altro che 
scrivere il contenuto del registro di carry RC. 
Istruzione ARM Traduzione LX 

@@@ Rdest .Rsorgl, imm Condition Evaluation 



Rshift_op = #imm 
RtC = RC 



Se invece e necessaria la rotazione, questa deve 
essere realizzata sul processore LX, che non ha nel suo 
set di istruzioni operazioni di rotazione, come una 
serie di shift ed or logici. II valore del carry deve 
essere aggiornato con 1' ultimo valore uscito dal 
registro Rshift_op in conseguenza della rotazione verso 
destra (che e anche il MSB dell ' immediato ruotato) . 

L • indirizzamento diretto da registro e codificato 
nell' opcode ARM come caso particolare 

dell ' indirizzamento con shift logico a sinistra da 
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immediate quando 1 1 immediate* e uguale a zero. La sua 
traduzione, analogamente all ' indirizzamento da 
immediate consiste solo nel muovere nel registro 
Rshift_op il contenuto del registro sorgente, mentre il 
5 carry non deve essere modificato. 

Si analizzano ora i modi di indirizzamento da 
registro scalato con ammontare dello shift espresso da 
un immediato . 

Shift logico a sinistra da immediato: 1'entita 

10 dello shift e espressa da un immediato a 5 bit 
contenuto nell' opcode. Oltre ad effettuare lo shift del 
registro sorgente, bisogna effettuare lo shift logico a 
destra complementare per aggiornare il carry. Con il 
solo shift il registro temporaneo di carry RtC non 

15 sarebbe aggiornato correttamente, perche il suo LSB 
conterra il valore con cui aggiornare il flag, ma altri 
bit del registro possono avere contenuto non nullo. 
Sara necessario, nelle fasi successive della 
traduzione, azzerare tutti gli altri bit del registro 

20 RtC mediant e un' operazione di AND logico. 

Shift logico a destra da immediato : d analogo al 
caso precedente, ma il carry flag deve essere 
aggiornato con 1' ultimo bit uscito dal registro 
Rshift_op in aeguito all ' operazione di shift a destra. 

25 Shift aritmetico a destra da immediato: e analogo 

al caso precedente, con la particolarita ' che se 
1' ammontare dello shift e zero si effettua uno shift 
aritmetico di 31 posizioni, cioe si mantiene nel 
registro il solo segno del contenuto del registro 

30 Rsorg2 . 

Rotazione a destra da immediato: come gia detto il 
processore L.X non ha una istruzione di rotazione, 
quindi si deve realizzare la rotazione come serie di 
shift e OR logici. 
35 II carry flag va aggiornato con 1' ultimo bit uscito 
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dal registro Rsorg2 in seguito alia rotazione a destra. 

Shift logico a destra da registro: e analogo al 
caso precedente, ma se l'entita dello shift non e 
nulla il carry flag deve essere aggiornato con 1' ultimo 
5 bit uscito da Rshif t_op in seguito all ' operazione di 
shift a destra. 

Shift aritmetico a destra da registro : e 
assolutamente analogo al caso precedente, con l'unica 
differenza che i due shift, owiamente, devono essere 
10 aritmetici e non logici . 

Rotazione a destra da registro: se il valore e 
nullo non deve dare alcun effetto. Altrimenti bisogna 
effettuare la rotazione ed aggiornare il carry flag con 
1' ultimo bit uscito dal registro Rsorg2 in seguito alio 
15 shift a destra. 

Perche la rotazione venga effettuata correttamente 
mediante gli shift, se l'ammontare della rotazione e 
maggiore o uguale a 31 occorre troncare (una rotazione 
a destra di 35 posizioni d infatti equivalente ad una 
20 rotazione di 3) . Occorre comunque distinguere i casi di 
rotazione di zero dalla rotazione di multipli di 32, 
perche nel secondo caso il carry flag deve essere 
aggiornato . 

Una volta ottenuto l'operando, che viene sempre 
25 memorizzato nell ' apposito registro Rshif t_op, viene 
tradotta la parte di esecuzione dell' opcode ARM. 

Tra le istruzioni di data-processing vi sono 8 
istruzioni logiche e 8 aritmetiche. 
Le istruzioni logiche sono: 
30 - AND (AND logico) ; 

- EOR (OR esclusivo) ; 

- ORR (OR inclusivo) ; 

- BIC (bit clear) ; 

MOV (move to register) ; 
35 - MVN (move negated) ; 



- TST (test: aggiorna i flag in conseguenza di un AND 
logico) ; 

TEQ (test equivalence: aggiorna i flag in 
conseguenza di un OR esclusivo) . 
5 Queste istruzioni non modificano il flag di 

overflow e aggiornano il flag di carry in base alia 
precedente fase di predisposizione dell ' operando, come 
descritto precedentemente . 

Le operazioni di test, a differenza delle altre, 
10 non modificano il contenuto di nessun registro di uso 
generale ma solo i flag del registro CPSR. 
Le istruzioni aritmetiche sono: 

- ADD (somma) ; 

ADC (somma con riporto) ; 
15 - SUB (sottrazione : sottrae il valore dello shifter- 
operand a quello di un registro; 

- RSB (reverse subtract : sottrae il valore di un 
registro a quello dello shifter-operand) ; 

SBC (sottrazione con riporto borrow); 
20 - RSC (reverse subtract con riporto borrow) ; 

CMP (compare: aggiorna i flag in conseguenza della 
sottrazione tra i due operandi) ; 

CMN (compare negated: aggiorna i flag in conseguenza 
della somma dei due operandi) ; 
25 Queste istruzioni modificano il flag di overflow e 

il flag di carry in base al risultato. 

La valutazione di questi due flag d diversa per la 
somma e per la sottrazione e viene effettuata nella 
successiva fase di committment. 
30 Le operazioni di confronto, a differenza delle 

altre, non modificano il contenuto di nessun registro 
di uso generale ma solo i flag del registro CPSR. 

Visto che tutte le operazioni di data processing 
possono supportare l'esecuzione condizionale, il 
35 risultato dell ' esecuzione viene memorizzato in un 
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registro destinazione teraporaneo indicato come Rt_dest 
in tabella 3. 

Come esempio di istruzione logica del processore 
ARM, la parte di esecuzione dell ' istruzione BIC (bit 
5 clear) e tradotta in questo modo : 

Istruzione ARM Traduzione LX 

BIC @ @ Rdest,Rsorgl @ @ @ Condition Evaluation 



2 nd Operand Generation 



Rtempl = Rsorgl +Rshift_op 



Rt_dest = Rtempl + RC 



Si noti come i bit alti del registro temporaneo di 
carry RtC vengano azzerati in quest a fase del la 
traduzione, dato che nella precedente fase di 
generazione del secondo operando tale registro pud 
10 essere stato aggiornato semplicemente con un ' operazione 
di shift. 

Come esempio di operazione aritmetica, si considera 
1 ' istruzione ADC (add with carry) : 
Istruzione ARM Traduzione LX 

ADC @ @ Rdest , Rsorgl , @ @ ® Condition Evaluation 



2 nd Operand Generation 



Rtempl = Rsorgl +Rshift_op 



Rt_dest = Rtempl + RC 



Nel caso delle operazioni aritmetiche, qualora 
15 1' istruzione richieda 1 ' aggi ornament o dei flags, il 
carry flag andra aggiornato in base al risultato della 
somma o della sottrazione e quindi non e necessario 



mascherare il contenuto del registro RtC, che sara 
ignorato nel seguito del processo di traduzione. 

L 1 ultima fase della traduzione e quella di 
commitment. In questa fase, se la condizione di 
5 esecuzione e verificata, nel registro destinazione 
viene scritto il valore del registro destinazione 
temporaneo Rt_dest . 

Tutte Ie operazioni di data-processing possono poi 
opzionalmente modificare il registro di stato; fanno 
10 eccezione le operazioni di test e confronto che 
eseguono obbligatoriamente quest ' opera zi one . 

Dal momento che il processore LX non present a un 
registro di stato, in questa fase verranno svolte, se 
richiesto dal valore alto del bit 21 dell 'opcode ARM, 
15 una serie di istruzioni sul registro destinazione per 
stabilire come aggiornare i flag. 

II flag di zero viene portato a livello alto se il 
risultato di una operazione e zero . 

II flag di segno viene aggiornato con il bit piu 
20 signif icativo del risultato. 

II flag di carry per le operazioni logiche viene 
aggiornato in base all 'ultimo bit uscito dal registro 
sorgente in seguito alio shift nella fase di 
generazione degli operandi. 
25 Per le operazioni di somma, C=l indica la presenza 

di un riporto (carry) e viene impostato se: 

- entrambi gli addendi sono negativi; 

- uno degli addendi e negativo e il risultato e 
positivo. 

30 Per le operazioni di sottrazione, C=0 indica la 

presenza di riporto (borrow) . Considerando 1' operazione 
RES = A - B , con o senza riporto , C=l se : 

- A e negativo e B positivo; 

- uno dei termini e negativo e il risultato positivo. 
35 ii flag di overflow non e modificato dalle 
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operazioni logiche . 

Per le operazioni di somma, V=l se : 
entrambi gli operandi sono positivi e il risultato 
negativo / 

5 - entrambi gli operandi sono negativi ed il risultato 
positivo; 

Per le operazioni di sottrazione (vedi sopra) , V=l 

se : 

- A e negativo, B e positivo e il risultato e 
10 positivo ,- 

A e positivo, B e negativo e il risultato e 
negativo . 

E per velocizzare questa fase che ognuno dei 
quattro flag (C, Z, N, V) e calcolato e memorizzato in 
15 un apposito registro temporaneo (RtC, RtZ, RtN, RtV) 
per poi essere salvato, se la condizione di esecuzione 
e verificata, in un registro opportuno (RC, RZ, RN, 
RV) . 

Questo ultimo gruppo di registri sara poi usato per 

20 valutare la condizione di esecuzione delle successive 
istruzioni ARM. Si sottolinea ancora che il registro 
ARM_GPSR che emula il comport amento del registro CPSR 
del processore ARM non viene aggiornato in 
corrispondenza di pgni istruzione che lo modifica ma 

25 solamente quando si verifica un' operazione di lettura 
su di esso, in modo che il valore letto sia coerente 
con quello letto nella normale esecuzione dello stesso 
programma su ARM. 

Oltre alia modifica dei flag, in questa fase viene 

30 aggiornato il valore del registro del processore LX che 
emula il program counter del processore ARM indicato 
con ARM_R15/ARM_PC in tabella 3. 

Se R15 non e il registro destinazione , al valore 
corrente (owero PC + 8) viene sottratto 4 per puntare 

35 alia prossima istruzione ARM. 
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Se R15 e il registro destinazione, il registro 
ARM_PC viene aggiornato di conseguenza ed il processore 
LX e forzato ad effettuare un salto a link al nuovo 
valore di tale registro. 
5 Se inoltre occorre aggiornare il registro di stato, 

nel registro CPSR viene caricato il registro SPSR 
associato al modo corrente ed occorre eseguire una 
complessa procedura di switch del modo di lavoro del 
processore ARM . 

10 Se l'istruzione non causa un salto, il dispositivo 

traduttore e in grado autonomamente di puntare alia 
successiva istruzione ARM in memoria, mentre se 
l'operazione modifica il contenuto del program- counter 
del processore ARM e necessario forzare il dispositivo 

15 a puntare al nuovo valore di ARM_PC. 

Questo e facilmente ottenibile scrivendo il nuovo 
valore del program-counter ARM in memoria all ■ indirizzo 
associato all ' Istruzione ARM-pointer del dispositivo 
traduttore. 

20 Per le istruzioni aritmetiche di somma (ADD, ADC) 

che richiedono 1 ' aggiornamento del registro di stato e 
non causano salti, si ricorda che 1 ' aggiornamento dei 
flag di carry ed overflow awiene in questo modo: 

C=l indica la presenza di un riporto ' (carry) e 

25 viene impostato se: 

- entrambi gli addendi sono negativi 

- uno degli addendi e negativo e il risultato e 
positivo 

V=l se: 

30 - entrambi gli operandi sono posit ivi e il risultato 
negativo 

- entrambi gli operandi sono negativi ed il risultato 
positivo 

La fase di commitment e" quindi tradotta sul 
35 processore LX in questo modo: 
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Istruzione ARM Traduzione LX 

ADDS®® Rdest, Rsorgl, @@® Condition Evaluation 



2 nd Operand Generation 



Execution 



RtN=Rt_dest»31 

Rtempl =. Rshift_op » 31 

Rtemp2 = Rsorgl » 31 

Rdest = ($Condition) ? 

Rt dest : Rdest 



Rtemp3 = Rtempl && Rtemp2 

Rtemp4 = (Rtempl ==0) && 
(Rtemp2 == 1) 

Rtempl = Rtempl && (RtN == 
0) 

R temp 2 = Rtemp2 && (RtN == 
0) 



Rtempl = Rtempl | | Rtemp2 
Rtemp2 = Rtemp4 && (RtN == 
0) 

Rtemp4 = Rtemp3 && (RtN == 
0) 

RN = ($Condition) ? RtN : RN 



RtV = Rtemp2 [ | Rtemp4 
RtC = Rtempl | | • 'Rtemp3 
RtZ = (Rt_dest == 0) 



RC = ($Condition) ? RtC : RC 
RV = ($Condition) ? RtV : RV 
RZ = ($Condition) ? RtZ : RZ 
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ARM PC = ARM PC - 4 
Per 1 ' istruzione di cpnfronto CMN, che effettua una 
somma ma non va a scrivere il risultato dell ' operazione 
in un registro di uso generale, la traduzione della 
fase di commitment diventa owiamente la seguente : 
Istruzione ARM Traduzione LX 

CMN®@Rsorgl , @@@ Condition Evaluation 

2 nd Operand Generation 



Execution 



RtN=Rt_dest»31 

Rtempl = Rshift_op » 31 

Rtemp2 = Rsorgl » 31 



Rtemp3 


= Rtempl &Sc Rtemp2 


Rtemp4 


= (Rtempl ==-. 0) && 


(Rtemp2 


== 1) 


Rtempl 


= Rtempl ScSc (RtN == 


0) 




Rtemp2 


= Rtemp2 && (RtN == 


0) 





Rtempl = Rtempl | | Rtemp2 
Rtemp2 = Rtemp4 && (RtN == 
0) 

Rtemp4 = Rtemp3 && (RtN = = 
0) 

RN = ($Condition) ? RtN : RN 



RtV = Rtemp2 | | Rtemp4 
RtC = Rtempl | | Rtemp3 
RtZ = (Rt_dest == 0) 
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RC = ($Condition) ? RtC : RC 
RV = ($Condition) ? RtV : RV 
RZ o ($Condition) ? RtZ : RZ 
ARM PC = ARM PC - 4 
Per le istruzioni aritmetiche di sottrazione (SUB, 
SBC, RSB, RSC) che richiedono 1 ' aggi ornament o del 
registro di stato e non causano salti, si ricorda che 
1 ' aggiornamento dei flag di carry ed overflow awiene 
5 in questo modo : 

C=0 indica la presenza di riporto (borrow) . 
Considerando l'operazione RES = A - B , con o senza 
riporto , C=l se : 

- A e negativo e B positivo; 

10 - uno dei termini e negativo e il risultato positivo. 
V=l se: 

- A e negativo, B d positivo e il risultato e 
positivo; 

- A e positivo, B e negativo e il risultato e 
15 negativo. 

Quando invece il registro destinazione e il 
program- counter del processore ARM ed e richiesto 
1 ' aggiornamento del registro di stato, e necessario 
leggere i 5 LSB del registro di stato per individuare 

20 il modo di lavoro corrente e scegliere quale delle 
repliche del registro di stato SPSR salvare nel 
registro CPSR. . Segue una complessa procedura che 
consente di ef fettuare lo switch del modo di lavoro 
corrente del processore ARM, che di fatto ricalca quasi 

25 perfettamente la traduzione dell ' istruzione ARM MSR 
(move to status register from general -purpose 
register) . 

Per la descrizione dettagliata di questa procedura 
si rimanda percio alia successiva descrizione della 
30 traduzione dell ' istruzione MSR. 

Ad ogni modo la traduzione dell ' istruzione ADDS che 
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usa come registro destinazione il program counter 
predispone il link-register di LX, detto LX_LR, ad 
effettuare il salto e forza il dispositivo traduttore a 
puntare al nuovo valore di ARM_PC. 
5 Questo e ottenuto scrivendo il nuovo valore del 

program- counter ARM in memoria all ' indirizzo associato 
all ' Istruzione ARM-pointer del dispositivo traduttore. 

Analogamente, se non e richiesto 1 ' aggiornamento 
del registro di stato, CPSR non deve essere modificato 

10 e la traduzione si semplifica. 

Owiamente l'uso di immediati a 32 bit nella 
traduzione (ad esempio ARMPOINTER_ADDR) deve seguire i 
vincoli imposti dal processore LX per la codifica degli 
immediati. II dispositivo traduttore deve assicurare 

15 che gli immediati lunghi Vengano posizionati in 
indirizzi di memoria corrispondenti ad un numero di 
word pari, come richiesto dal core LX. 

I 3 LSB dell ' indirizzo in cui si codifica 
1 • immediato lungo devono essere cioe sempre nulli . 

20 Similarmente alle istruzioni di data-processing si 

comportano le istruzioni di moltiplicazione e 
moltiplicazione con accumulo. Queste istruzioni 
supportano pero' solamente 1 ' indirizzamento diretto da 
registro e, sebbene support ino l'opzione -S, non 

25 modificano mai i flag di carry e di overflow ma solo 
quelli di segno e di zero. 

Mentre il processore ARM e in grado di effettuare - 
anche moltiplicazioni di numeri a 3 2 bit ottenendo un 
risultato a 64 bit che viene spezzato su due registri 

30 destinazione, il processore LX pud solamente effettuare 
moltiplicazioni di numeri a 16 bit o di un numero a 16 
bit con uno a 32, troncando comunque il risultato a 32 
bit. 

Per questo motivo le moltiplicazioni 32x32 del 
35 processore ARM devono essere realizzate sul processore 



44 



LX come una serie di moltiplicazioni 16x16 e di somme 
con riporto, seguendo il seguente procedimento . 

Siano A e B i due operandi a 32 bit contenuti nei 
due registri sorgente; si indicano con AH e BH le 
5 half word alte di A e di B e con AL e BL le half word 
basse . 

A = AL + AH * 2 16 

B = BL + BH * 2 16 

A * B = AL * BL + (AH * BL + AL * BH) * 2 16 + AH * 
10 BH * 2 32 

Nei caso di moltiplicazione 32x32 di tipo signed, 
prima si determinano i valori assoluti di A e 
calcolando il complemento a due dei numeri negativi, 
dopo di che si effettua la moltiplicazione unsigned 

15 come descritto in precedenza. In base al segno degli 
operandi gia estratto in precedenza si calcola quindi 
il segno del risultato, che se negativo richiede di 
effettuare il complemento a due del numero a 64 bit 
ottenuto dalla moltiplicazione dei valori assoluti. 

20 Una volta valutata la condizione di esecuzione, 

viene tradotta 1' esecuzione della moltiplicazione. 

Se l'istruzione e" una MUL, si effettua una 
moltiplicazione di due numeri a 32 bit con risultato 
troncato a 32 bit. Il posizionamento nei bundle delle 

25 operazioni di moltiplicazione deve rispettare i vincoli 
impost i dal processore LX. ii dispositivo traduttore 
deve assicurare che le moltiplicazioni vengano 
posizionate in indirizzi di memoria corrispondenti ad 
un numero di word dispari, come richiesto dal core LX. 

30 13 LSB dell ' indirizzo in cui si codifica 

1 ■ immediato lungo devono cioe essere 10 0. 

Devono inoltre essere rispettati i vincoli sulla 
latenza delle moltiplicazioni, che e doppia rispetto a 
quella delle istruzioni di data-processing. 

35 Se l'istruzione e una MLA (multiply and 
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accumulate) , al risultato di una istruzione MUL deve 
essere aggiunto il contenuto di un terzo registro 
sorgente Rsorg3 . 

Se 1' istruzione e una UMULL (unsigned multiply), 
5 si deve effettuare la moltiplicazione di due numeri 
unsigned a 32 bit e spezzare il risultato a 64 bit 
ottenuto su due registri : la parte alta e salvata nel 
registro temporaneo Rt_dest in attesa della fase di 
commitment, mentre la parte bassa e salvata nel 

10 registro temporaneo Rtempl . 

Per 1' istruzione UMLAL (unsigned multiply and 
accumulate) , occorre soltanto sommare al risultato 
della' istruzione UMULL il numero a 64 bit 
precedentemente contenuto nei registri RdHi e dLo, 

15 ricordandosi di propagare il riporto della somma. 

Se 1' istruzione e una SMULL (signed multiply), si 
deve effettuare la moltiplicazione di due numeri signed 
a 32 bit in cbmplemento a due e spezzare il risultato a 
64 bit ottenuto su due registri : la parte alta e 

20 salvata nel registro temporaneo Rt_dest in attesa della 
fase di commitment, mentre la parte bassa e salvata in 
Rtempl . 

Per effettuare la moltiplicazione signed, prima si 
calcolano i valori assoluti dei due operandi, poi si 
25 effettua • la moltiplicazione unsigned come per 
1' istruzione UMULL ed alia fine, se i due operandi 
avevano segno discorde, si effettua il complemento a 
due del numero a 64 bit risultante dalla 
moltiplicazione dei valori assoluti. 
30 La traduzione e quindi la seguente : 

Istruzione ARM Traduzione LX 

SMULL®® RdHi,RdLo,Rsorgl, Condition Evaluation 

Rsorg2 

Rtempl = - Rsorgl 
Rtemp2 = - Rsorg2 
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Rtemp3 =Rsorgl »3 1 
Rtemp4 = Rsorg2 » 31 



$Negl = (Rtemp3 == 1) 
$Neg2 = (Rtemp4 == 1) 
$PosRes = (Rtemp3 == Rtemp4) 



Rtemp7 = ($Negl)? Rtempl 
Rsorgl 

Rtemp8 = ($Neg2)? Rtemp2 
Rsorg2 



$CarryO = O 

Rtempl = 161sb_of (Rtemp7) * 
16msb_of (Rtemp"8) 
Rtemp2 = 16lsb_of (Rtemp8) * 
16msb_of (Rtemp7) 



Rtemp3 = 16lsb_of (Rtemp7 ) * 
16lsb_of (Rtemp8) 
Rtemp4 = 16msb_of (Rtemp7) * 
16msb_of (Rterap8) 



Rtempl 


= Rtempl 




16 


Rtemp5 


= Rtempl 


» 


16 


Rtemp2 


= Rtemp2 


« 


16 


R temp 6 


= Rtemp2 




16 



Rtemp5 = Rtemp5 + Rtemp6 
$Carryl , Rtempl = Rtempl + 
Rtemp3 + $ Carry 0 



$Carry2 , Rtemp8 = Rtemp4 + 
Rtemp5 + $ Carry 1 
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$Carryl,Rtemp7 = Rtempl + 
Rtemp2 + $CarryO 



$Carry2 , Rtemp8 = Rtemp8 + 
$Carryl 

$LowIsZero = (Rtemp7 = = 0) 
Rtempl = - Rtemp7 



Rtemp3 = - Rtemp8 

Rtempl = ($PosRes) ? Rtemp7 : 

Rtempl 



$Carry2 , Rtemp2 = Rtemp3 + 
$LowIsZero 



Rt_dest = ($PosRes)? Rtemp8 
: R temp 2 



Si noti che, per effettuare il complemento a due 
del risultato a 64 bit occorre verificare se i 32 bit 
meno signif icativi siano tutti zeri o raeno per decidere 
se la parte superiore debba essere complementata a due 
5 o negata. 

Per l'istruzione SMLAL (signed multiply and 
accumulate) , occorre soltanto sommare al risultato 
dell ' istruzione SMULL il numero a 64 bit 
precedentemente contenuto nei registri RdHi e RdLo, 

10 ricordandosi di propagare il riporto della s omnia . 

Come le istruzioni di data-processing, le 
moltiplicazioni supportano l'opzione -S e terminano con 
una fase di commitment analoga che per6 non aggiorna i 
flag di overfolw e carry. 

15 Dal punto di vista della traduzione, le operazioni 

di accesso a memoria differiscono f ondamentalmente 
dalle operazioni di data-processing perchd non possono 



48 



essere eseguite in maniera predicativa. Infatti, mentre 
e possibile effettuare comunque una somma o una 
moltiplicazione per poi decidere se scriverne o meno il 
risultato nel registro destinazione , questo approccio 
5 evidentemente non ha senso per le operazioni di 
scrittura in memoria. 

Tale metodo inoltre non e applicabile nemmeno per 
le operazioni di lettura, perche se l'accesso in 
lettura awiene in una locazione di memoria sulla quale. 

10 e mappato un dispositivo (si pensi ad esempio ad una 
UART) , l'accesso pud causare la perdita o la modifica 
dell ' inf ormazione contenuta in quella locazione. 

Anche per i motivi espressi sopra, la traduzione 
delle operazioni sulla memoria segue un procedimento 

15 differente da quello per le istruzioni di data- 
processing . 

Le istruzioni di accesso singolo in memoria 
comprendono le istruzioni del modo 2 che quelle del 
modo 3. Tutte queste istruzioni impiegano per 
20 1 ' indirizzamento un registro base al quale viene 
sommato o sottratto un offset che pud essere ottenuto 
con varie modalita. 

Le istruzioni del modo 2 sono le operazioni di 
load&store di word e unsigned byte. Le modalita di 
25 indirizzamento supportate sono nove : 

registro base +/- immediato a 12 bit; 
registro base +/- registro offset; 

registro base +/- registro offset scalato (il 
registro offset e shiftato con modalita analoghe 
30 alle istruzioni di data-processing; l'entita dello 

shift e descritta da un immediato) ; 

registro base +/- immediato pre -indexed (il registro 
base viene aggiornato prima di effettuare l'accesso 
a memoria) ; 

35 - registro base +/- registro offset pre- indexed; 
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registro base +/- registro scalato pre-indexed; 
registro base +/- immediate* post-indexed (il 
registro base viene aggiornato dopo avere effettuato 
l'accesso a memoria) ; 
5 - registro base +/- registro offset post-indexed; 

registro base +/- registro scalato post-indexed. 
Le operazioni di load & store in memoria del modo 3 
agiscono su halfword e signed byte. Le modalita di 
indirizzamento supportate sono sei delle nove associate 
10 al modo 2 : 

registro base +/- immediato a 8 bit; 

- registro base +/- registro offset; 
registro base+/- immediato pre-indexed; 

- registro base +/- registro offset pre-indexed; 
15 - registro base +/- immediato post-indexed; 

- registro base +/- registro offset post -indexed. 

Come spiegato in precedenza, il processore ARM 
consente di realizzare accessi a word con indirizzi non 
word-aligned, mentre il processore LX non lo consente 

20 ed in questi casi scatena un'eccezione. Per questo 
motivo la traduzione degli accessi in memoria del 
processore ARM deve necessariamente prevedere una 
operazione di troncamento per generare indirizzi word o 
half word-aligned. Inoltre essendo sia il processore ARM 

25 che LX processori potenzialmente bi-endian, qualora 
1 ' endianness , cioe la rappresentazione degli interi da 
destra a sinistra o sinistra a destra, dei due sistemi 
sia diversa e necessario effettuare 1 ' opportuna 
operazione di swap per word o halfword. 

30 La traduzione delle istruzioni dei modi 2 e 3 

awiene con due processi analoghi, che si dif f erenziano 
solo per i modi di indirizzamento supportati e per le 
diverse traduzioni della fase di accesso a memoria. 
Queste differenze, come si vedra meglio in seguito, 

35 sono finalizzate ad ottenere in ogni caso la traduzione 
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piu velocemente eseguibile su processore LX . 

Dopo la prima fase di decodif ica e traduzione del 
campo condizionale come per le istruzioni di data- 
processing, si ha la traduzione del modo di 
5 indirizzamento e la conseguente generazione 
dell ' indirizzo per 1 ' accesso a memoria. 

In questa fase si calcolano sia 1' indirizzo per 
1' accesso in memoria sia il valore con cui, se 
necessario, si dovra aggiornare il registro base al 
10 termine dell ' esecuzione dell ' istruzione . 

I due valori vengono memorizzati rispettivamente 
nei registri temporanei Rshift_op e Rtemp6 . 

Viene quindi tradotta l'operazione di load o store, 
che come spiegato in precedenza deve per prima cosa 
15 verificare se la condizione di esecuzione e verificata 
o meno e, in caso negative non effettuare 1' accesso ma 
saltare all 'ultimo bundle della traduzione per poi 
effettuare il salto a link ed accedere quindi alia 
successiva istruzione ARM da eseguire. 
20 Si analizza ora nel dettaglio la traduzione di 

alcuni deu vari modi di indirizzamento, partendo da 
quelle comuni ai modi 2 e 3 . 

La modal ita di indirizzamento e descritta dai bit 
che vanno dal 21 al 2 5 dell' opcode ARM. 
25 Nel caso di indirizzamento con registro base +/- 

immediato, il registro base non deve essere aggiornato, 
mentre il registro Rshift_op, che sara utilizzato come 
puntatore alia memoria, deve contenere il risultato 
della somma (o della sottrazione) del registro base e 
30 dell 1 immediato lungo offset: 

Istruzione ARM Traduzione LX 

LDR® @ Rdest, [Rbase, # +i- Condition Evaluation 

imm] 

Rtemp6 = Rbase 

Rshift_op = Rbase + 
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#sign_imm sign_imm = +/- 

sign_imm = +/- imm 

Nel caso di indirizzamento con immediato pre- 
indexed, anche il registro base deve essere aggiornato 
alia fine dell ' operazione , quindi si va a modificare il 
registro Rtemp6 di conseguenza. 
5 Nel caso di indirizzamento con immediato post- 

indexed, il registro base dovra essere aggiornato alia 
fine dell ' operazione ma l'accesso a memoria dovra 
essere effettuato al valore corrente del registro base. 

Nel caso di indirizzamento con offset contenuto in 
10 un registro, si opera analogamente . 

Le operazioni del modo 2 supportano anche gli 
indirizzamenti con registro offset scalato (con le 
solite modalita LSL, LSR, ASR, ROR, RRX) . La traduzione 
di queste modalita consiste dapprima nell ' ottenimento 
15 dell 'offset mediante le operazioni di shift o 
rotazione, e poi nell ' aggiornamento dei registri Rtemp6 
e Rshift_op con le modalita gia viste. 

Una volta tradotto il modo di indirizzamento viene 
tradotta l'esecuzione dell'accesso a memoria. La 
20 traduzione dell'accesso varia totalmente in base al 
formato del dato da leggere o scrivere in memoria. 

Gli accessi a byte non present ano problemi di 
endianness ne di allineamento . Esempi di accessi a byte 
sono l'istruzione STRB (store unsigned byte, modo 2), 
25 l'istruzione LDRB (load unsigned byte, modo 2) . 

Si noti che, a causa della latenza dell ' operazione 
di load byte che richiede di attendere due bundle per 
accedere al byte letto, si deve inserire un bundle 
vuoto al fine di rendere il contenuto del registro 
30 Rdest immediatamente disponibile all ' istruzione ARM 
successiva ed evitare cosi read-hazards. 

Si noti inoltre che, essendo possibile che il 
registro destinazione coincida con il registro base 
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quando quest' ultimo non richiede di essere aggiornato 
dalle modalita post- o pre-indexed, occorre realizzare 
in due bundle separati prima la scrittura nel registro 
Rbase e poi quella nel registro Rdest . 
5 L'istruzione LDRSB (load signed byte) fa parte del 

modo 3 e come tale non ammette 1 ' indirizzamento con 
registro offset scalato. 11 byte letto e esteso con 
segno . 

II processore LX richiede che le operazioni di 

10 memoria che coinvolgono half word siano half word- 
aligned, mentre il processore ARM all'atto dell'accesso 
in memoria ignora l'ultimo bit dell ' indirizzo, per poi 
eventualmente scambiare i due byte letti tra di loro se 
il bit scartato era un 1 . 

15 Le operazioni di store invece ignorano 

completamente l'ultimo bit. 

Occorre inoltre prestare attenzione alle endianness 
del processore ARM e LX: se i due sistemi usano 
convenzioni diverse e necessario scambiare tra di loro 

20 i byte dell ' half word letta. 

L'accesso ad halfword del processore ARM sara 
quindi tradotto in due singoli accessi a byte di tipo 
unsigned per rendere piu veloce 1'esecuzione nel caso 
in cui e necessario uno swap dei byte del la halfword 

25 (cioe trasformare la parola esadecimale xxxxYyZz nel la 
parol a xxxxZzYy) . 

L'istruzione LDRH (load unsigned halfword, modo 3) 
legge byte per byte la halfword dal registro 
destinazione e la scrive nel registro destinazione 

30 effettuando o meno lo swap in base all ' endianness del 
processore ARM ed al bit meno signif icativo 
dell ' indirizzo. L'altra halfword del registro 
destinazione viene riempita di zeri . 

Si sottolinea come, per risparmiare tempo nel caso 

35 in cui fosse necessario effettuare lo swap dei byte 
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letti, vengono precalcolat^; sia la word letta che la 
sua versione swapped e/ poi si sceglie la versione 
corretta in base anche cill ' endianness del sistema ARM. 
L * endianness del processore LX in questo caso e 
5 inlnfluente perche gli accessi sono realizzati byte per 
byte . 

L'istruzione LDRSH (load signed halfword, modo 3) e 
simile alia precedente con l'unica differenza che i 
byte vengono letti con segno e poi il meno 
10 signif icativo e mascherato con OxOOFF per costruire la 
halfword gia sign-extended. 

La strategia di traduzione, per il resto, e 
identica al caso precedente. 

Nel caso big endian, e ancora sufficiente scambiare 
15 i ruoli di Rtempl ed Rtemp2 nell' ultimo bundle. 

Per la traduzione degli accessi a word e scelto 
un'approcio differente: rispetto ad effettuare quattro 
accessi a byte consecutivi per poi costruire la word in 
base all' endianness del processore ARM, si preferisce 
20 effettuare un singolo accesso a word allineato per poi 
eventualmente effettuare lo swap dei byte qualora le 
endianness del processore ARM e del processore LX siano 
diverse . 

In tal modo, se il processore ARM ed il processore 
25 LX hanno la stessa endianness il guadagno in termini di 
velocita di esecuzione e notevole, mentre quando le 
endianness sono diverse, le due soluzioni, con quattro 
accessi o con singolo accesso, sono pressoche 
equivalent i . 

30 L'istruzione STR (store word, modo 2) ignora i due 

bit meno signif icativi dell ' indirizzo ed e quindi self- 
aligned. Quando le endianness del processore ARM e di 
LX sono diversi, la traduzione dell ' istruzione 
comprende lo swap dei byte del la word letta: la parola 

35 esadecimale OxAaBbCcDd viene trasformata in OxDdCcBbAa . 
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Se le due endianness invece sono uguali tutti i bundle 
dedicati alio swap sono risparmiati . 

L'istruzione LDR (load word, modo 2) ha un processo 
di traduzione piu coraplesso per vari motivi : 
5 - l'accesso e effettuato trascurando i due bit meno 
signif icativi dell ' indirizzo, ma poi la parola letta 
deve essere swapped se le endianness del processore 
ARM e del processore LX sono diverse ed anche 
ruotata verso destra di un numero di posizioni pari 
10 ad otto volte il valore dei due bit di indirizzo 

ignorati (ad esempio, se 1' indirizzo termina per 11 
la word deve essere ruotata di 24 posizioni) ; 
se il registro destinazione della operazione load e 
il program- counter del processore ARM, l'istruzione 
15 pud generare un sal to ed occorre quindi assicurarsi 

che il valore caricato sia word-aligned e 
predisporre il dispositivo traduttore a puntare 
all' istruzione ARM obiettivo del salto. 
A prescindere dal fatto che il registro 
20 destinazione sia o meno il registro ARM_PC, la prima 
parte della traduzione £ la stessa e, nel caso in cui 
sia necessario effettuare lo swap, si ha: 
Istruzione ARM Traduzione LX 

LDR@@ Rdest, [ Rbase, @ @ @ Condition Evaluation 

Address generation 



Rshift_op = Rshift_op & 
OxFFFFFFFC 

Rtemp5 = Rshift_op & 0x03 
Rbase = ($Condition) ? Rtemp6 
: Rbase 

IF ( ! $Condition) GOTO end 
Rt dest 



MemoryWord (Rshif t_op) 
Rtemp5 = Rtemp5 « 3 
Bundle dedicati Rtempl = OxOOFF 

esclusivamente 

All'operazione di swap Rtemp6 = 32 - Rtemp5 



Rtempl = 


Rtempl « 


8 


Rtemp3 = 


Rtempl « 


16 


Rtemp2 = 


Rt_dest 


» 8 


Rtemp4 = 


Rt_dest 


« 8 


Rtempl = 


Rt_dest 


» 24 


Rtemp3 = 


Rt_dest 


« 24 


R temp 2 = 


Rtemp2 & 


Rtempl 


Rtemp4 = 


Rtemp4 & 


Rtemp3 


R temp 2 = 


Rtempl | 


Rtemp2 


Rtemp4 = 


Rtemp4 | 


Rtemp3 


Rt_dest = 


= Rtemp2 


| Rtemp4 


Rt_dest = Rt_dest 


» Rtemp5 


Rtempl = 


Rt_dest 


« Rtemp6 



Rdest = Rtempl ] Rt_dest 
Effettuato 1 ' accesso alia memoria e completate le 
eventuali operazioni di swap e rotazione della parola 
letta, se il registro destinazione non e ARM_PC la 
traduzione termina semplicemente aggiornando il program 
counter stesso: 

Istruzione ARM Traduzione LX 

LDR® @ Rdest, [ Rbase, @ @ @ Condition Evaluation 



Address generation 
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Memory Access 



end: ARM_PC = ARM_PC - 4 
Quando invece il registro destinazione e proprio 
ARM_PC, la versione 5 dell ' instruction-set del 
processore ARM richiede che la parola letta sia resa 
half word-aligned e che il bit meno signif icativo della 
5 parola stabilisca se entrare o meno in Thumb- state , 
sellando il bit 5 del registro di stato ARM_CPSR. 

Occorre poi predisporre il dispositivo a puntare 
all ' indirizzo destinazione del salto. 
Istruzione ARM Traduzione LX 

LDR@@ R15, [Rbase, @@@ Condition Evaluation 



Address generation 



Memory Access 



Rtempl = ARM_PC & 1 

LXJLR = ARM_PC & OxFFFFFFFE 
Rtemp3 = ARMPOINTER_ADDR 



Rtempl - Rtempl « 5 

ARM.CPSR = ARM_CPSR & 
OxFFFFFFDF 

ARM PC = ARM_PC & OxFFFFFFFE 



MemoryWord (Rtemp3) = ARM_PC 
ARM_PC = ARM_PC + 4 
ARM.CPSR = ARM_CPSR | Rtempl 



GOTO LX_LR 

End : ARM PC = ARM_PC - 4 
Le operazioni di load & store multiple del modo 4 
10 contengono all'interno del loro opcode un campo di 16 
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bit che marca con un bit a livello alto i registri 
interessati al trasf erimento . 

Gli ultimi sedici bit dell 'opcode vengono quindi 
esaminati uno ad uno e, per ogni bit a livello alto, 
5 viene effettuata una operazione di load word o store 
word sul registro associato a quel bit . 

Queste operazioni presentano quattro modi di 
indi r i z zament o : 

- increment after (suf fisso - IA) ; 
10 - increment before (suffisso -IB) ; 

- decrement after (suffisso -DA) ; 
decrement before (suffisso -DB) . 

II registro base, se specif icato dal bit 21 
dell 'opcode a livello alto, viene aggiornato alia fine 
15 di ogni load o store singolo con il valore della 
successiva locazione puntata. 

Occorre sottolineare che, sia che 1 ' aggiornamento 
awenga per decremento che per incremento, i registri 
con numero piu alto sono associati agli indirizzi piu 
20 alti e quelli con numero piu basso agli indirizzi piu 
bassi . 

Esistono poi versioni delle load & store multiple 
eseguibili solo in modo di f unzionamento privilegiato 
che consentono di caricare dal la memoria il program 

25 counter o di accedere ai egistri di uso generale del 
modo User. Avendo mappato ogni registro del processore 
ARM, compresi quelli replicati, su un registro del 
processore LX, l'accesso ai registri del modo User d 
ottenibile in maniera immediata. 

30 II mapping dei registri del processore ARM sul 

processore LX, dettagliato in tabella 3, £ gestito 
mappando i registri del modo cor rente sui registri del 
processore LX da R16 a R31, in maniera tale che la 
traduzione delle operazioni risulti immediata. Per la 

35 grande maggioranza delle istruzioni del processore ARM 
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infatti sono solo questi i registri accessibili ed il 
registro del processore LX e ricavabile dal registro 
del processore ARM specif icato nell' opcode 
sempli cement e sommando 16 al numero identif icativo del 
5 registro. 

I registri R13 ed R14 del processore ARM replicati 
per i modi Supervisor, Interrupt, Abort e Undefined 
sono mappati sui registri che vanno da R4 0 a R4 6, che 
serviranno come registri "di stack" per R2 9 e R3 0 

10 quando il modo corrente e diverso da quello cui e 
associato il registro replicato. 

Alio stesso modo R45 e R46 costituiscono i registri 
di stack per R13 e R14 per i modi User e System, cosi 
come R54 e R55 per il modo Fast Interrupt (FIQ) . 

15 I registri da R40 a R44 del processore LX 

costituiscono un'area di stack che conterra i registri 
da R8 a Rll del modo User del processore ARM quando il 
modo corrente e Fast Interrupt, oppure i registri 
replicati del modo Fast Interrupt da R8 a RII quando 

20 questo non e il modo corrente. 

Le operazioni di load multiple possono anche 
caricare un dato dalla memoria nel program counter del 
processore ARM generando un salto e, nella versione 5 
dell ' instruction-set , aggiornare il registro CPSR con 

25 il registro SPSR del modo corrente. Le operazioni di 
load del program counter vengono quindi trattate in 
maniera diversa da quelle che interessano gli altri 
registri, anche perche occorre evitare che venga 
caricato in ARM_PC un valore non word-aligned. 

30 Va inoltre sottolineato che ogni operazione di 

store del program counter scrive in memoria il valore 
aggiornato, pari al PC dell ' istruzione corrente 
aumentato di otto. 

Tutte le operazioni del modo 3 effettuano solo 

35 accessi word-aligned, ignorando i due bit meno 



signif icativi del registro base. II valore aggiornato 
del registro base, tuttavia, verra calcolato 
considerando anche questi ultimi due bit. 

L'istruzione STM (multiple store) presenta due 
modalita di esecuzione: 

- nel modo 1 l'istruzione e eseguibile sotto qualsiasi 
modo di lavoro del processore ARM e consente di 
salvare in locazioni consecutive di memoria un 
sottoinsieme qualunque dei registri del modo 
corrente ; 

nel modo 2 l'istruzione e eseguibile solo in un modo 
privilegiato, mentre il suo effetto e imprevedibile 
nei modi User e System. Quest a modalita consente di 
salvare in memoria un sottoinsieme qualunque dei 
registri dei modi User/System. 
II processo di traduzione dell ' istruzione STM, a 
parte la consueta valutazione della condizione di 
esecuzione, pud essere suddiviso in tre f asi : 

- una fase iniziale, in cui ottiene un indirizzo word- 
aligned mascherando i due bit meno signif icativi del 
registro base e, se la condizione di esecuzione non 
e verificata, si salta alia fine del programma . Nel 
modo 2 in questa fase si legge il registro di stato 
CPSR per capire se il modo di lavoro del processore 
ARM e User/System, FIQ (e quindi presenta piQ 
registri replicati) o un altro modo privileged; 

- un ciclo che scandisce i 16 bit . meno signif icativi 
dell 'opcode e per ognuno di essi, in base al 
registro ed al modo di lavoro corrente, traduce la 
scrittura in memoria con l'eventuale swapping 
qualora l'endianness dei sistemi ARM ed LX 
differisca. L'ordine di scansione della lista dei 
registri, sia che 1 1 aggiornamento degli indirizzi 
awenga per decremento che per incremento, deve 
essere tale per cui i registri con numero piO alto 
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vengano associati agli indirizzi piu alti e quelli 
con numero piu basso agli indirizzi piu bassi; 

una fase finale, in cui si aggiorna il registro 
ARM_PC, il cui contenuto non pud essere modificato 
5 dall ' istruzione STM, e se necessario si effettua il 

writeback del registro base. Sebbene durante 
l'accesso a memoria i due bit meno signif icat ivi 
dell ' indirizzo debbano essere ignorati per generare 
accessi word-aligned, durante la fase di writeback 
10 bisogna tenerne conto. 

Nella traduzione viene inserita una NOP (no 
operation) esplicita per dare tempo al core LX di 
valutare la condizione di esecuzione prima 
dell ' eventuale salto. Il processore LX richiede infatti 
15 che tra la scrittura in un branch-bit e 1' esecuzione 
del salto ad esso condizionato intercorra almeno un 
bundle di istruzioni . 

La scansione dei bit della lista di registri 
interessati al trasf erimento parte dal bit 0 ed arriva 
20 al bit 15 in caso di indirizzamento per incremento, 
mentre procede in senso opposto se 1 ' indirizzamento d 
per decremento. A seconda che 1 ' indirizzamento sia di 
tipo before o after, il valore del registro base deve 
essere aumentato (nel caso increment) o diminuito di 4 
25 (nel caso decrement) prima o dopo aver effettuato la 
scrittura in memoria di ogni registro. 

Nel modo 1 i registri da scrivere in memoria sono 
quelli associati al modo di lavoro corrente del 
processore ARM: questi registri sono sempre mappati sui 
30 registri di LX che vanno da R16 (ARM_RO) a R31 (ARM_R15 
/ ARM_PC) . 

Se le endianness dei processori ARM ed LX sono 
uguali, non d necessario dedicare dei bundle alio swap. 
La traduzione dell ' istruzione precedente e valida 
35 anche per 1' istruzione STM del modo 2 per i registri 
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non replicati in nessun modo privileged, owero ARM_R15 
e tutti i registri da ARM_RO ad ARM_R7 . 

Al contrario, nel modo 2 per i registri da ARM_R8 
ad ARM_R12 guesta traduzione non e adatta. Questi 
5 registri infatti sono replicati per il modo FIQ e 
quando il processore ARM entra in questa modalita i 
registri da R8 ad R12 del modo User/System sono salvati 
nei registri del processore LX che vanno da ARM_R8 stack 
ad ARM_R12 stack La traduzione deve quindi iniziare 

10 scegliendo quale registro scrivere in memoria tra 
ARM_Rxstack (se la modal ita corrente e FIQ) ed ARM_Rx 
(in tutti gli altri casi) . 

L' ultimo caso da considerare e quello 
dell ' istruzione STM di modo 2 per i registri R13 e R14 . 

15 In questo caso i registri sono replicati per 

ciascuno dei modi privilegiati e quindi, quando il modo 
corrente non e User o System, occorre salvare il 
registro ARM_R13stack o ARM_R14 stack invece del 
corrispondente registro di modo corrente ARM_R13 o 

20 ARM_R14 . 

La traduzione della istruzione STM termina con 
1' aggi ornament o del registro ARM_PC ed eventualmente 
con 1 ' aggiornamento del registro base se 1* istruzione 
richiede il writeback. 
25 L' istruzione LDM (multiple load) presenta tre 

modalita di esecuzione differenti: 

- nel modo 1 1' istruzione e eseguibile sotto qualsiasi 
modo di lavoro del processore ARM e consent e di 
leggere da locazioni consecutive di memoria 

30 scrivendo i dati letti in un sottoinsieme qualunque 

dei registri del modo corrente; 

- nel modo 2 1' istruzione e eseguibile solo in un modo 
privilegiato, mentre il suo effetto e imprevedibile 
nei modi User e System. Questa modalita consent e di 

35 salvare i dati letti dalla memoria in un 



sottoinsieme qualunque dei registri dei modi 
User/System. II contenuto di ARM_PC non pud essere 
modificato; 

- nel modo 3 l'istruzione e eseguibile solo in un modo 
5 privilegiato, mentre il suo effetto e imprevedibile 

nei modi User e System. Questa modal ita consent e di 
salvare i dati letti dalla memoria in un qualsiasi 
sottoinsieme dei registri di modo corrente che 
comprenda il registro ARM_PC. Inoltre, il registro 
10 ARM_3PSR del modo corrente e copiato in ARM_CPSR. E 

necessario leggere i 5 LSB del registro di stato per 
individuare il modo di lavoro corrente e scegliere 
quale delle repliche del registro di stato SPSR 
salvare nel registro CPSR. Segue una complessa 
15 procedura che consente di effettuare lo switch del 

modo di lavoro corrente del processore ARM, che di 
f atto ricalca quasi perf ettamente la traduzione 
dell' istruzione ARM MSR (move to status register 
from general -purpose register) . Per la descrizione 
20 . dettagliata di questa procedura si rimanda percio 
alia successiva descrizione della traduzione 
dell • istruzione MSR. 

II processo di traduzione dell ' istruzione LDM e 
analogo a quello della istruzione STM ma, per quanto 
25 detto in precedenza, deve rispettare piu casi 
particolari. 

Evidentemente, la scrittura sul program- counter del 
processore ARM pud generare un sal to nell 1 esecuzione 
del codice ARM ed il dispositivo traduttore deve essere 
30 preparato ad eseguirlo andando a puntare all ' istruzione 
destinazione del sal to. 

La traduzione e del tutto analoga a quel la della 
fase iniziale dell ' istruzione STM, con l'unica 
differenza che il bundle di attesa del branch-bit che 
35 precede il sal to condizionato e sfruttato per caricare 
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il link-register del processore LX in previsione del 
salto incondizionato da effettuare a fine traduzione. 

Per i modi 1 e 3, che accedono ai soli registri del 
modo corrente, gli ultimi due bundle non sono 
5 necessari . 

La scansione dei bit della lista di registri 
interessati al trasf erimento segue esattamente la 
stessa regola usata per l'istruzione STM. 

Anche in questo caso poi, a seconda che 

10 1 ' indirizzamento sia di tipo before o after, il valore 
del registro base deve essere aumentato (nel caso 
increment) o diminuito di 4 (nel caso decrement) prima 
o dopo aver effettuato la lettura in memoria ed il 
caricamento del valore letto in ogni registro. 

15 Nei modi 1 e 3 i registri da scrivere sono quelli 

associati al modo di lavoro corrente del processore 
ARM: questi registri sono sempre mappati sui registri 
del processore LX che vanno da R16 (ARM_RO) a R31 
(ARM_R15/ ARM_PC) . 

20 La traduzione precedente e valida anche per 

l'istruzione LDM del modo 2 per i registri non 
replicati in nessun modo privileged, owero quelli che 
vanno da ARM_R0 ad ARM_R7 . 

Al contrario, nel modo 2 per i registri da ARM_R8 

25 ad ARM_R12 questa traduzione non va bene. Questi 
registri infatti sono replicati per il modo FIQ e 
quando il processore ARM entra in questa modalita i 
registri da R8 ad R12 del modo User/System sono salvati 
nei registri LX che vanno da ARM_R8 s t ack ad 

30 ARM_R12stack. 

La traduzione deve quindi, una volta realizzati 
l'accesso a memoria e l'eventuale swap, terminare 
scegliendo in quale registro scrivere il dato letto tra 
ARM_Rxstack (se la modalita corrente e FIQ) ed ARM_Rx 

35 (in tutti gli altri casi) . 



Si noti come, in questo caso, solo quattro dei 
bundle dedicati alio swap possono essere evitati se i 
sistemi hanno la stessa endianness. L'operazione di 
load word infatti ha latenza doppia rispetto alle 
5 istruzioni LX di data-processing, e richiede percid un 
bundle di attesa tra l'operazione di accesso a memoria 
e l'utilizzo del registro destinazione . 

Una traduzione ancora diversa richiedono le 
scritture dei registri R13 ed R14 di modo User/System, 

10 per 1 ' istruzione LDM di modo 2. In questo caso i 
registri sono replicati per ciascuno dei modi 
privilegiati e quindi, quando il modo corrente non e 
User o System, occorre scrivere il registro 
ARM_R13 stack o ARM_R14 stack invece del corrispondente 

15 registro di modo corrente ARM_R13 o ARM_R14 . 

Restano da analizzare i casi di scrittura del 
program- counter nei modi 1 e 3. 

Nel primo caso e necessario effettuare il salto al 
valore scritto nel program- counter del processore ARM e 

20 predisporre il dispositivo traduttore al salto 
forzandolo a puntare all ' indirizzo destinazione del 
salto. La versione 5 dell ' instruction-set del 
processore ARM richiede che la parola letta sia resa 
half word- aligned e che il bit meno signif icativo della 

25 parola stabilisca se entrare o meno in Thumb- state, 
impostando il bit 5 del registro di stato ARM_CPSR. 

Nel modo 3 invece, per la versione 5 
dell' instruction-set del processore ARM, e necessario 
effettuare il salto al valore scritto nel program- 

30 counter del processore ARM e predisporre il dispositivo 
traduttore al salto forzandolo a puntare all ' indirizzo 
destinazione del salto. 

Se il processore ARM sta lavorando in Thumb- state 
la parola letta deve essere resa half word-aligned, 

35 altrimenti deve essere resa word- aligned. 
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In entrambi i casi comunque il registro di stato 
ARM_SPSR del modo corrente deve essere scritto nel 
registro di stato ARM_CPSR. 

La traduzione dell ' istruzione LDM termina con 
5 1' aggi ornament o del registro ARMJPC (che se e stato 
caricato da una operazione di load precedente e anche 
gia stato incrementato di quattro) ed eventualmente con 
1 ' aggiornamento del registro base se 1' istruzione 
richiede il writeback. 
10 Se invece il registro ARM_PC non e modificato e non 

e richiesto il writeback, la traduzione della fase 
finale diventa piu semplice. 

II processore ARM presenta altre due istruzioni di 
accesso a memoria: SWP (swap word) e SWPB (swap byte. 
15 Queste istruzioni effettuano ciascuna due accessi a 
memoria, caricando in un primo registro il contenuto di 
una locazione di memoria puntata da un registro base e 
scrivendo nella stessa locazione di memoria il 
contenuto di un secondo registro. Se il primo e il 
20 secondo registro coincidono, si sono scambiati i 
contenuti del registro e della locazione di memoria. 

L. 1 istruzione SWP si comporta esattamente come una 
coppia di istruzioni LDR e STR, quindi deve tenere 
conto dell 'endianness dei due sistemi ed effettuare 
25 l'eventuale rotazione della word letta in base ai due 
bit meno signif icativi dell ' indirizzo . 

Si noti che se le endianness dei due sistemi sono 
diverse le operazioni di swap da fare sono due : una 
sulla word letta dall ' operazione di load ed una prima 
30 di effettuare 1' operazione di store. 

Si sottolinea che per il processore ARM tutte le 
operazioni di swap che coinvolgono il program- counter, 
sia come operando che come registro base, sono 
imprevedibili . 

35 L ' istruzione SWPB non presenta problemi di 
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endianness ed ha una traduzione molto piu semplice, con 
l'awertenza di separare le due ultime istruzioni 
del la traduzione, per fare in modo che nel primo bundle 
della traduzione della successiva istruzione ARM si 
5 possa accedere al registro di destinazione Rdest senza 
dare luogo a read-hazard. 

Le istruzioni LX per la lettura di un byte in 
tnemoria {LDB e LDBU) richiedono infatti che si. attenda 
per due bundle prima di accedere al byte letto. 
10 II processore ARM presenta poi tre istruzioni di 

salto: 

salto condizionato PC-relative (con e senza memoria 
dell ' indirizzo di ritorno) : 1' offset di 24 bit e 
contenuto nell' opcode del salto. Per calcolare 

15 1' indirizzo di destinazione esso viene moltiplicato 

per quattro (in quant o ogni opcode ARM occupa 32 
bit) ed esteso con segno, per poi essere sommato al 
valore attuale del program counter. E opportuno 
sottolineare che, in conseguenza dell ' architettura 

20 della pipeline del processore ARM, al momento 

dell ' aggiornamento che awiene nella fase di 
esecuzione, il program counter contiene 1' indirizzo 
dell ' istruzione di salto incrementato di otto; 
salto incondizionato con cambiamento di modo: il 

25 processore effettua un salto con offset di 24 bit, 

mantiene memoria dell ' indirizzo di ritorno nel link 
register ed entra in modo Thumb, modificando il T 
bit della parola di stato; 

salto condizionato con cambiamento di modo (con o 
30 senza memoria dell ' indirizzo di ritorno): il 

processore effettua un salto all ' indirizzo contenuto 
in un registro indice. Il valore del registro indice 
viene allineato trascurandone il bit meno 
signif icativo, che viene utilizzato per decidere il 
35 modo di f unzionamento (se a livello alto modo Thumb, 
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altriraenti modo ARM) . 

Sia i salti ad offset PC-relative che quelli da 
registro vengono tradotti su LX con una operazione di 
salto a link, anche in conseguenza del fatto che il 
5 processore ARM pud realizzare salti PC-relative piu 
lunghi del processore LX, i cui opcodes contengono un 
campo che fornisce 1' offset di un bit piu corto 
rispetto ad ARM. 

L'istruzione ARM B (branch) effettua un salto 
10 condizionato PC-relative senza tenere memoria 
dell ' indirizzo di ritorno nel link-register. 

L' offset contenuto nell' opcode deve essere esteso 
con segno e moltipllcato per due per ottenere 1' offset 
espresso come numero di byte. 
15 La sua traduzione comincia con la consueta 

valutazione della condizione di esecuzione e continua 
nel modo seguente : 

Istruzione ARM Traduzione LX 

B@@ signed_of f set Condition Evaluation 

Rt_dest = ARM_PC . + 

#byte_off set 
ARM_PC = ARM_PC-4 

ARM_PC = ($Condition) ? 

Rt_dest : ARM_PC 

LX_LR = ($Condition) ? 

Rt_dest : ARM_PC 

Byte_of f set = signed_of f set 

« 2 Rshift_op = ARMPOINTER_ADDR 

MemoryWord (Rshif t_op) = 
LX_LR 

GOTO LX_LR 

L'istruzione BL (branch and link) effettua un salto 
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condizionato PC-relative, tenendo memoria 

dell' indirizzo di ritorno nel link-register del 
processore ARM (R14) . 

L'istruzione BX (branch and exchange to Thumb) 
5 effettua un salto condizionato all ' indirizzo contenuto 
in un registro target, senza tenere memoria 
dell ' indirizzo di ritorno. 

II valore contenuto nel registro target Rtarget va 
reso half word- aligned ed il suo bit meno significative 
10 scartato durante l'operazione di allineamento, va a 
modificare il T-bit del registro di stato ARM_CPSR. 
Portando il T-bit a livello alto il processore entra 
nella modalita Thumb. 

L'istruzione BLX (branch, link and exchange to 
15 Thumb) del modo 2 e identica alia precedente BX ma 
tiene memoria dell ' indirizzo di ritorno nel link- 
register del processore ARM. 

Esiste anche un 1 altra versione dell ' istruzione BLX 
che effettua un salto PC-relative e che viene 
20 denominata modo 1 . 

Questa istruzione non supporta l'esecuzione 
condizionale e contiene all'interno dell'opcode un 
offset immediato a 24 bit che va moltiplicato per 
quattro, esteso con segno e quindi sommato al valore 
25 corrente del program counter. 

II bit 24 (H bit) dell'opcode va moltiplicato per 
due e sommato al valore aggiornato del program- counter 
per ottenere un indirizzo destinazione comunque 
hal f word- aligned . 
30 II processore ARM deve sempre entrare in Thumb- 

state. 

II processore ARM presenta inoltre due istruzioni 
dedicate alia manipolazione dei registri di stato che 
consentono la lettura e la scrittura dei registri di 
35 stato CPSR e SPSR associati al modo corrente. 
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Se l'istruzione ha come sorgente o destinazione 
SPSR, dal momento che tutti i modi di f unzionamento del 
processore ARM, tranne il modo User ed il modo System, 
hanno uno SPSR replicato, la prima cosa da fare e 
5 individuare il modo corrente sulla base del contenuto 
del registro LX che emula il registro CPSR del 
processore ARM. 

Non volendo accedere direttamente alle risorse del 
.core LX, si individua il modo corrente (descritto dai 

10 cinque bit meno signif icativi del CPSR) tramite una 
serie di operazioni di confronto che impostano un 
diverso branch-bit di LX per ogni modo di lavoro del 
processore ARM. Per le operazioni di lettura dello 
stato (MRS), a questo punto mediante una serie di 

15 operazioni di select (SLCT) si decide cosa scrivere nel 
registro destinazione. Per le operazioni di scrittura 
(MSR) , sempre attraverso una serie di select, si 
aggiorna solo il valore del SPSR associato alio stato 
corrente mentre gli altri vengono lasciati invariati . 

20 L'accesso al registro CPSR owiamente non presenta 

questo problema, ma la sua scrittura pud forzare un 
cambiamento del modo di lavoro del processore ARM. Il 
mapping dei registri del processore ARM su LX e stato 
descritto in precedenza ed e rappresentato nella 

25 tabella 3. 

Le operazioni MSR (move to status-register from 
register) modificano con un' immediato o con il 
contenuto di un registro sorgente uno o piu dei byte 
componenti un registro di stato. 

30 I byte da modificare sono individuati dalla 

maschera che occupa i bit dal 16 al 19 dell 'opcode: per 
ogni bit alto della maschera il corrispondente byte 
della parola di stato viene modificato. 

Si considera inizialmente il caso di 

35 indirizzamento da registro, con CPSR come destinazione. 



70 

La traduzione di questa istruzione prevede i 
seguenti passi, che devono essere eseguiti da tutte le 
istruzioni che possono cambiare il modo di lavoro del 
processore ARM : 
5 1) si determina il modo di lavoro corrente del 

processore ARM mediante una serie di operazioni di 
confronto che impostano un diverso branch-bit per ogni 
modo e si mascherano il registro sorgente ed il 
registro CPSR con due maschere complementari . 
10 La scrittura sul registro CPSR in modo User deve 

essere ignorata. 

Istruzione ARM Traduzione LX 

MSR CPSR_<f ields>, Rsorg Condition Evaluation 



NOP 



Rtempl = ARM_CPSR & 0x0 IF 
Rtemp2 = Rsorg & #field_mask 
IF (! $Condition) GOTO end 



Field_mask 




Mask 


( $IsUSR= 


(Rtempl= 


<fields>) 






$IsSYS= 


(Rtempl= 








$IsFIQ = 


(Rtempl 








$IsSPV= 


(Rtempl 



$IsIRQ= (Rtempl==18) 
$IsUND = (Rtempl = = 27) 
$IsABT = (Rtempl == 23) 



Rtempl = ARM_CPSR & (~ 

#f ield_mask) 

IF ($IsUSR) GOTO end 



2) si scambiano i contenuti dei registri da R8 a 
R12 del processore ARM con quelli corrispondenti della 
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zona di stack, per prepararsi ad una eventuale 
transizione al modo FIQ 

Istruzione ARM Traduzione LX 

MSR CPSR_< fields >, Rsorg 



ARM_R8 = ARM_R8 stack 
ARM_R8 stack = ARM_R8 
ARM_R9 = ARM_R9 stack 
ARM R9stack = ARM_R9 



ARM_R10 = ARM_R10stack 
ARM_R10stack = ARM_R10 
ARM_R11 = ARM_R1 I Stack 
ARM Rll stack = ARM_R11 



ARM_R12 = ARM_R12 stack 
ARM_R12 stack = ARM_R12 
IF ($IsSPV) GOTO spv_jproc 



3) individuato il mc 
valori dei registri R13 
registri replicati 
Istruzione ARM 
MSR CPSR_<fields>, Rsorg 



d corrente, si salvano i 
e R14 nei corrispondenti 

Traduzione LX 



IF ($TsIRQ) GOTO irq proc 



IF ($IsUND) GOTO undj)roc 



IF ($IsABT) GOTO abt_proc 



IF ($IsFIQ) GOTO fiq_j)roc 
Spvjproc : ARM_R13spv 
ARM_R13 

ARM_R14spv = ARM_R14 
GOTO continue 
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i rq_j?roc : ARM_R1 3 i rq 

ARM_R13 

ARM_R14irq = ARM_R14 
GOTO continue 



und_proc: ARM_R1 3 und=ARM_Rl 3 
ARM_R 14und = ARM_R14 
GOTO continue 



abt_proc : ARM_R1 3 abt 

ARM_R. 13 

ARM_R1 4 abt == ARM_R14 
GOTO continue 



fiq_proc: ARM_R13fiq 
ARM_R13 

ARM_R14fiq = ARM_R14 



4) si aggiornano il registro CPSR ed i registri dei 

flag 

Istruzione ARM Traduzione LX 

MSR CPSR_<f ields>, Rsorg 



continue: ARM_CPSR = Rtempl 
| Rtemp2 



Rtempl = ARM_CPSR & OxOlF 



RtV = ARM. CPSR » 28 
RtC = ARM_CPSR » 29 
RtZ = ARM_CPSR » 30 



RN = ARM_CPSR » 31 
RV = RtV & 0x01 
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RC = RtC & 0x01 
RZ=RtZ&Ox01 

5) si determina il nuovo modo di lavoro del 
processore ARM come al punto 1 
Istruzione ARM Traduzione LX 

MSR CPSR_<f ields>, Rsorg $IsFIQ = (Rterapl == 17 ) 



$IsSPV = (Rtempl == 19 ) 

$IsIRQ = (Rtempl == 18 ) 

Rtemp6 = (Rtempl == 31 ) 

R temp 5 = (Rtempl == 16 ) 



$IsUND = (Rtempl == 27 ) 
$ I sABT = (Rtempl == 23 ) 
$IsUNPRV = (Rtemp6 == 1) 
(Rtemp5 ==1) 
IF ($IsFIQ) GOTO get_fiq 



6) se non c'£ stato un passaggio al modo FIQ 
riscambio i valori dei registri che sono stati spostati 
al punto 2) 

Istruzione ARM Traduzione LX 

MSR CPSR_<fields>, Rsorg 



ARM_R8 - ARM_R8 stack 
ARM_R8 s t ack = ARM_R8 
ARM_R9 = ARM_R9stack 
ARM_R9 stack = ARM_R9 



ARM_R10 = ARM_R10 stack 
ARM_R10 Stack = ARM_R10 
ARM_R1 1 = ARM_R1 I stack 
ARM_R11 stack = ARM_R11 
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ARM_R12 = ARM_R12 stack 
ARM_R12 stack = ARM_R12 

7) si scrivono in R13 e R14 il contenuto dei 
registri replicati associati al nuovo modo 
Istruzione ARM Traduzione LX 

MSR CPSR_<f ields>, Rsorg 



IF$isSPV) GOTO get.spv 



IF ($IsIRQ) GOTO get Jrq 



IF ($IsUND) GOTO get_und 



IF ($IsABT) GOTO get_abt 



ARM_R13 = ARM_R13 stack 
ARM_R14 = ARM_R14 stack 



get_spv : ARM_R1 3 

ARM_R13spv 

ARM_R14 = ARM_R14spv 

GOTO end 



get_rq: ARM_R13 = ARM_R13irq 
ARM_R14 = ARM_R 1 4 i r q 
GOTO end 



ge t_und : ARM_R1 3 

ARM_R 1 3 und 
ARM_R14 = ARM_R14und 
GOTO end 
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get_abt : ARM_R . 1 3 

ARM_R13abt 

ARM_R14 = ARM_R14abt 

GOTO end 



get_fiq: ARM_R8 
ARM_R8 stack 
ARM_R8 stack = ARM_R8 
ARM_R9 = ARM_R9 stack 
ARM_R9 stack = ARM_R9 



ARM_R10 = ARM_R10 stack 
ARM_R10stack = ARM_R10 
ARMJR11 = ARM_Rllstack 
ARM Rl I stack = ARM_R11 



ARM_R12 = ARMJR.12 stack 
ARM_R12 stack = ARM_R12 
ARM_R13 = ARM_R1 3 f iq 
ARM_R14 = ARM_R14f iq 



end : ARM_PC = ARM_PC - 4 
L'istruzione MSR che scrive nel registro CPSR un 
immediato ha una traduzione del tutto analoga alia 
precedente . 

Quando invece il registro destinazione 
5 dell ' istruzione MSR e il registro SPSR del modo 
corrente, la traduzione cambia perche occorre 
individuare lo stato corrente e nel frattempo preparare 
gli aggiornamenti degli SPSR per i vari modi (l'accesso 
al SPSR nei modi User e System rende imprevedibile 
10 1 ' esecuzione) . 

Alia fine viene aggiornato solo il registro SPSR 
del modo corrente, tramite l'istruzione MSR_SPSR. 

L'operazione MRS (move to register from status- 



76 



register) che legge il registro CPSR necessita di 
ricostruire il contenuto informative* del CPSR stesso, 
che in questa implement azione e distribuito tra 
ARM_CPSR ed i quattro registri dei flag RC, RN, RZ, RV. 
5 L'istruzione supporta l'esecuzione condizionale . 

L'operazione MRS (move to register from status- 
register) che legge il registro SPSR del modo corrente 
deve prima leggere il registro CPSR per individuare il 
modo corrente e la sua esecuzione ha risultato 
10 imprevedibile nei modi User e System che non hanno un 
registro SPSR. 

Oltre alle istruzioni gia descritte, il processore 
ARM presenta altre istruzioni speciali: 

- BKPT (software breakpoint ) ; 
15 - SWI (software interrupt) ; 

istruzioni per la gestiohe dei coprocessori (load 
from coprocessor, store to coprocessor, coprocessor 
data-processing, ecc . ) 
L' istruzione di breakpoint software serve solamente 
20 in fase di debugging e pertanto non deve essere 
presente in nessun file eseguibile per un processore 
ARM. Di conseguenza £ stata tradotta sul processore LX, 
come anche tutti gli opcode che risultano non definiti, 
in una system cali del tipo Illegal Instruction. 
25 Alio stesso modo sono state trattate le operazioni 

sui coprocessori, non essendo nei nostri attuali 
obiettivi l'emulazione completa di un sistema hardware 
basato sul processore ARM. 

Le interruzioni software consentono al processore 
30 ARM di interagire con 1' hardware del sistema e possono 
essere tradotte in tre modi : 

- come Illegal Instruction, se non si vuole emulare 
1' hardware del sistema; 

- come salto ad un apposito ARM exception-handler 
35 scritto per il processore LX, che si occupa di 
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chiamare la system- call del processore LX 
corrispondente al servizio di software interrupt 
invocato dal processore ARM. Questa soluzione pud 
essere attuata in fase di sviluppo del sistema misto 
5 ARM-LX per verificare la corretta esecuzione dei 

programmi ; 

- avendo a disposizione il codice di tutti gli 
exception handlers ed il contenuto dei vettori di 
interrupt, l'istruzione SWI pud essere tradotta 
10 sempli cement e come passaggio al modo Supervisor del 

processore ARM e sal to con link al vet tore degli 
interrupt. Le operazioni di gestione dello stato e 
di salvataggio e ripristino dei registri sono 
infatti present i esplicitamente nel codice ARM e non 
15 sono realizzate dall' opcode SWI. Questa scelta 

consente l'emulazione di un sistema cbmpleto basato 
sul processore ARM, ma per funzionare correttamente 
necessita di un sistema di memoria che realizzi una 
partizione tra memoria ARM e memoria LX, in cui 
20 nella memoria ARM saranno mappate le periferiche del 

processore ARM che non hanno un equivalente nel 
sistema LX e in cui gli accessi a periferiche gia 
presenti nel sistema LX siano reindirizzati alle 
corrispondenti locazioni della memoria del 
25 processore LX. 

Da quanto sopra descritto, risulta evidente che la 
traduzione degli opcode del processore ARM sul 
processore LX ha un impatto pesante sulle prestazioni 
del sistema, ad esempio nella traduzione di una 
30 istruzione di data-processing che non modifica il 
registro di stato. 

Per ogni istruzione ARM appartenente a questa 
categoria occorrono almeno quattro bundle del 
processore LX, quindi a pari frequenza di clock 
35 1' esecuzione del codice ARM sul processore LX rallenta 
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di quattro volte. 

Si ha un peggioramento ulteriore per le istruzioni 
di moltiplicazione, di accesso a memoria e per i salti. 

Da una analisi sull ' esecuzione di alcuni benchmark 
5 scritti in codice ARM emergono alcune osservazioni di 
rilievo: 

le operazioni di data-processing sono mediamente il 
50% del totale delle istruzioni eseguite; 

- oltre il 90% delle istruzioni non sfruttano 
10 1' esecuzione condizionale; 

delle operazioni di data-processing, circa il 90% si 
suddivide in due modi di indirizzamento : quello 
diretto da registro e quello con immediato non 
ruotato; 

15 - delle operazioni di data-processing, meno del 20% 
richiede di modificare il registro di stato CPSR; 

- le istruzioni che modificano il registro CPSR sono 
nella gran parte dei casi operazioni di confronto 
(CMN, CMP) o di test logico (TST, TEQ) . 

20 In conseguenza di tutto cio, risulta conveniente 

complicare leggermente la fase di decodifica per 
aggiungere traduzioni ad hoc per le istruzioni piu' 
utilizzate . 

Questa modalita' di traduzione veloce e' 
25 applicabile quando tra gli operandi dell ' istruzione non 
e' presente il program- counter del processore ARM. 

Un' istruzione non condizionale di data-processing, 
se non modifica il registro di stato, viene tradotta in 
questo modo: 

30 - se 1 ' indirizzamento e diretto da registro 

Istruzione ARM Traduzione LX 

ORR@@ Rdest, Rsorgl , ®@@ Rdest =Rsorgl | Rsorg2 

ARM_PC=ARM_PC+4 
se 1 1 indirizzamento e da immediato non ruotato 
Istruzione ARM Traduzione LX 



J 
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ORR Rdest , Rsorgl , #short_imm Rdest = Rsorgl | #short_imm 

ARM PC = ARM_PC + 4 
Un'istruzione non condizionale di test logico o di 
confronto viene tradotta in questo modo : 

- se 1 ' indirizzamento e diretto da registro 
Istruzione ARM Traduzione LX 

CMP Rsorgl . Rsorg2 Rdest = Rsorgl - Rsorg2 

$Condition == 1 
ARM PC = ARM_PC + 8 



Commitment 

se 1' indirizzamento e da immediato non . ruotato 
Istruzione ARM Traduzione LX 

CMP Rsorg, #short_imm Rt_dest = Rsorg - #short_imm 

Rshift_op = #short_imm 
$Condition = 1 
ARM PC = ARM_PC + 8 



Commitment 

5 La fase di commitment awiene esattamente come 

descritto nel paragrafo precedente, ed e 1 per questo 
che il branch-bit Condition viene portato ad uno ed 
ARM_PC aumentato di otto. 

Con questa modifica la gran parte delle istruzioni 
10 di data-processing pud' essere eseguita in un singolo 
bundl e . 

La soluzione appena descritta consente di 
conseguire notevoli vantaggi rispetto alle soluzioni 
note . 

15 Si apprezzera che il principale vantaggio della 

soluzione secondo l'invenzione deriva dal fatto che 
1 ' introduzione di un dispositivo traduttore esterno 
permette di lasciare inalterato il core del 
microprocessore LX. Detto dispositivo traduttore, 

20 quando necessita di accedere alle risorse del core del 
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microprocessore LX, non lo accede direttamente , ma 
incorpora nella traduzione dell ' istruzione ARM dei 
costrutti condizionali basati sul contenuto dei 
registri o dei branch bit del core del microprocessore 
5 LX. 

Inoltre vantaggiosamente il dispositivo traduttore 
entra in azione autonomamente, riconoscendo gli accessi 
alia zona di memoria riservata al codice ARM. 

Gli esperti del settore apprezzeranno che la 

10 soluzione qui descritta con specifico riferimento alia 
traduzione di istruzioni ARM in istruzioni ST-200 LX e 
in realta applicabile ad un campo di impiego piu ampio, 
ossia alia traduzione delle istruzioni di un 
microprocessore scalare pipelined avente 

15 caratteristiche comunque riconducibili alle 

caratteristiche di un processore ARM verso un 
microprocessore del tipo VLIW. avente caratteristiche 
comunque riconducibili alle caratteristiche di un 
processore LX. Questo concetto e sta.to espresso nelle 

20 rivendicazioni che seguono facendo riferimento 
rispettivamente a processori Mi tipo ARM" e di "tipo 
LX" . Si osserva a tal proposito che la soluzione 
descritta e" applicabile anche ad un processore 
superscalare, il quale supporta renaming e esecuzione 

25 fuori ordine, rendendo possibili ottime prestazioni 
anche su traduzioni non perf ettamente/ottimizzate . 

Si apprezzera ancora che tali rivendicazioni fanno 
di per se riferimento a un primo insieme di istruzioni 
- eseguibili - su un processore di tipo ARM e ad un 

30 secondo insieme di istruzioni - eseguibili - su un 
processore di tipo LX. La menzione di tali tipi di 
processori e quindi destinata in via primaria ad 
identificare le caratteristiche di tali insiemi di 
istruzioni, non diversamente definibili. 
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Le istruzioni di tipo ARM e di tipo LX identificano 
in generale tutti i process i che coinvolgono 
architetture di set di istruzioni (ISA) equivalent i a 
quella descritta. 
5 Naturalmente, fermo restando il principio 

dell ' invenzione, i particolari di realizzazione e le 
forme di attuazione potranno essere ampiamente variati 
rispetto a quanto descritto ed illustrato, senza per 
questo uscire dall'ambito della presente invenzione, 
10 cosi come definita dalle rivendicazioni annesse. 



RIVENDICAZIONI 

1 . Procedimento per tradurre istruzioni 
appartenenti a un primo insieme di istruzioni 
eseguibili su un processore di tipo ARM in istruzioni 

5 appartenenti a un secondo insieme di istruzioni 
eseguibili su un processore di tipo LX comprendente un 
nucleo o core, caratterizzato dal fatto di comprendere 
le seguenti operazioni : 

prevedere un primo insieme di registri 
10 corrispondenti alle istruzioni di detto primo insieme, 
prevedere un secondo insieme di registri 
corrispondente alle istruzioni di detto secondo 
insieme, 

mappare ciascun registro di detto primo insieme in 
15 un corrispondente registro di detto secondo insieme 
destinato a emularne il comportamento realizzando una 
traduzione univoca indipendente dei dati di detto primo 
insieme di istruzioni in detto secondo insieme di 
istruzioni, 

20 dette operazioni di prowedere un secondo insieme 

di registri e di mappare essendo ottenute aggiungendo 
unita funzionali (10) a detto nucleo (14) , che e 
mantenuto inalterato 

realizzare detta traduzione in assenza di accesso 

25 diretto alle risorse di detto nucleo o core (14) . 

2. Procedimento secondo la rivendicazione 1, 
caratterizzato dal fatto che dette operazioni di 
prowedere un secondo insieme di registri e di mappare 
sono ottenute aggiungendo a detto core unita funzionali 

30 comprendenti un dispositivo di traduzione (10) esterno 
a detto nucleo (14) del processore di tipo LX, 

detto dispositivo di traduzione (10) eseguendo 
l'operazione di intercettare gli accessi a un'area di 
memoria (17) riservata alle istruzioni del primo 

35 insieme. 



3*. procedimento secondo la rivendicazione 2, 
carat terizzato dal fat to che comprende inoltre le 
operazioni di forzare un contatore di programma del 
processore di tipo LX a puntare a una memoria di 
5 traduzione (11) riservata nel dispositivo di traduzione 

(10) per contenere la traduzione (T) dell 1 istruzione 
appartenente al primo insieme di istruzioni che nel 
frattempo viene decodif icata . 

4. Procedimento secondo una o piu delle 
10 rivendicazioni precedenti, caratterizzato dal fatto di 
prevedere di caricare in detta memoria di traduzione 

(11) riservata tutte le istruzioni che cost ituiscono la 
traduzione dell ' istruzione del primo insieme 
decodif icata. 

15 5. Procedimento secondo una o piu delle 

rivendicazioni precedenti, caratterizzato dal fatto di 
associare inoltre a dette istruzioni che costituiscono 
la traduzione (T) dell 'istruzione del primo insieme 
decodificata un salto a link alia prossima istruzione 

20 del primo insieme da eseguire, in modo che tutte le 
• istruzioni del primo insieme non direttamente mappabili 
su una istruzione del secondo insieme necessitino di un 
salto all 'area di memoria riservata (11) e di un salto 
a link per caricare la successiva istruzione del primo 

25 insieme. 

6. Procedimento secondo una o piu delle 
rivendicazioni precedenti, caratterizzato dal fatto di 
tradurre tutte le istruzioni che non trovano una 
singola istruzione del secondo insieme di istruzioni 

30 equivalente in un salto incondizionato di tipo GOTO. 

7. Procedimento secondo una o piu delle 
rivendicazioni precedenti, caratterizzato dal fatto di 
comprendere l'operazione di forzare il contatore di 
programma associato al processore di tipo LX a emulare 

35 il funzionamento di un contatore di programma associato 



al processore di tipo ARM. 

8. Procedimento secondo la rivendicazione 7, 
caratterizzato dal fatto che detta operazione di 
forzare il contatore di programma associato al 
5 processore di tipo LX prevede che detto contatore di 
programma debba contenere lo stesso valore del 
contatore di programma associato al processore di tipo 
ARM all'atto del caricamento di un' istruzione 
appartenente al primo insieme di istruzioni . 
10 9. Procedimento secondo, la rivendicazione 8, 

caratterizzato dal fatto che al termine dell ' esecuzione 
emulata viene eseguito un salto all ' indirizzo della 
prossima istruzione appartenente al primo insieme di 
istruzioni . 

15 10. Procedimento secondo la rivendicazione 9, 

caratterizzato dal fatto che prevede di emulare il 
contatore di programma del processore di tipo ARM 
tramite un registro contatore (ARM_R15/ARM_PC) e di 
incrementare detto registro contatore (ARM_R15/ARM_PC) 

20 in modo che ogni istruzione che acceda a detto registro 
contatore (ARM_R15/ARM_PC) durante la fase di 
esecuzione abbia un comportamento coerente con 
1' esecuzione sul processore di tipo ARM e di 
decrement a re detto registro contatore (ARM_R15/ARM_PC) 

25 per puntare alia successiva istruzione appartenente al 
primo insieme di istruzioni. 

11. Procedimento secondo la rivendicazione 10, 
caratterizzato dal fatto che detto registro contatore 
(ARM_R15/ARM_PC) e incrementato di un valore otto e 

30 decrementato successivamente di un valore quattro. 

12. Procedimento secondo la rivendicazione 11, 
caratterizzato dal fatto che per le istruzioni 
appartenenti al primo insieme di istruzioni che hanno 
come destinazione il contatore di programma il 

35 puntamento alia successiva istruzione awiene caricando 
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in un link register del processore di tipo LX il valore 
aggiornato del registro contatore (ARM_PC) ed 
effettuando un salto incondizionato del tipo GOTO link. 

13. Procedimento secondo una delle rivendicazioni 
5 da 2 a 6, caratterizzato dal fatto che prevede di 

lasciare evolvere liberamente il contatore di programma 
associato al processore di tipo LX in assenza di salti. 

14. Procedimento secondo la rivendicazione 13, 
caratterizzato dal fatto che detto dispositivo di 

10 traduzione (10) § atto a eseguire le operazioni di 
intercettare gli accessi alia zona di meraoria riservata 
(17) alle istruzioni del primo insieme e a controllare 
un insieme di registri puntatori () per decidere se 
eseguire le prossime istruzioni come istruzioni del 

15 secondo insieme o come istruzioni del primo insieme da 
emulare. 

15. Procedimento secondo la rivendicazione 14, 
caratterizzato dal fatto che detto dispositivo di 
traduzione (10) e inattivo finche il nucleo del 

20 processore di tipo LX esegue istruzioni appartenenti a 
detto secondo insieme e rimanda gli accessi a memoria a 
dei dispositivi sottostanti, in particolare a una 
memoria cache di istruzioni () e che detto dispositivo 
di traduzione si attiva (10) quando si verifica un 

25 accesso alia zona di memoria (17) riservata a contenere 
il primo insieme di istruzioni . 

16. Procedimento secondo la rivendicazione 15, 
caratterizzato dal fatto che quando detto dispositivo 

• di traduzione si attiva, carica in un suo registro 
30 interno (NEXT_ARM_INSTR) appartenente all 'insieme di 
registri puntatori () l'indirizzo a cui si accede ed 
effettua la lettura dell ' istruzione dalla zona di 
memoria (17) corrispondente . 

17. Procedimento secondo la rivendicazione 16, 
35 caratterizzato dal fatto che prevede inoltre le 
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operazioni di tradurre detta istruzione letta dall'area 
di memoria riservata (17) e di memorizzare detta 
istruzione 

di allocare una finestra di esecuzione alia quale 
5 vengono rimandati tutti gli accessi ad indirizzi di 
memoria che partono dal valore corrente del contatore 
di programma del processore di tipo LX e coprono 
un'area pari a quella occupata dal la traduzione, 

di leggere tramite il nucleo del processore di tipo 
10 LX la prima istruzione della traduzione dall'area di 
memoria riservata (11) nel dispositivo di traduzione 

di incrementare il registro ( NEXT_ARM_I NSTR ) , in 
particolare di un valore quattro, per puntare alia 
prossima istruzione del primo insieme di istruzioni, 
15 di chiudere detta finestra di esecuzione dopo la 

lettura dell 'ultima istruzione del primo insieme da 
tradurre e, se al successivo accesso in memoria il 
registro (NEXT_ARM_INSTR) punt a al di fuori della zona 
di memoria riservata (11) , disattivare il dispositivo 
20 di traduzione (10) . 

18. Procedimento secondo la rivendicazione 17, 
caratterizzato dal fatto che prevede inoltre le 
operazioni di prevedere in presenza di salti nel 
programma costituito dalle istruzioni del primo insieme 

25 di riscrivere detto registro ( NEXT_ARM_ I NS TR ) mediante 
una operazione di store word contenuta nella traduzione 
in istruzioni del secondo insieme dell ' istruzione del 
primo insieme . 

19. Procedimento secondo una delle rivendicazioni 
30 precedenti caratterizzato dal fatto che 1' operazione di 

traduzione sul processore di tipo LX inizia con la 
verifica della condizione di esecuzione, che consiste 
nella valutazione di uno o piu dei flag presenti nel 
registro di stato (CPSR) . 
35 20. Dispositivo di traduzione di istruzioni 
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appartenenti a un primo insieme di istruzioni 
eseguibili su un processore di tipo ARM in istruzioni 
appartenenti a un secondo insieme di istruzioni 
eseguibili su un processore di tipo LX comprendente un 
5 nucleo o core, caratterizzato dal fatto che detto 
dispositivo di traduzione (10) comprende • un 
sottosistema di traduzione (12) atto a ricevere in 
ingresso un' istruzione (IA) del primo insieme e fornire 
in uscita una traduzione (T) comprendente una o piu 

10 istruzioni del secondo insieme, una memoria di 
traduzione (11) per me.morizzare detta traduzione (T) , 
un dispositivo di control lo (13) per prelevare detta 
traduzione (T) da detta memoria di traduzione (11) e 
fornirla al nucleo (14) di detto processore di tipo LX. 

15 21. Dispositivo secondo la rivendicazione 20 

caratterizzato dal fatto che detto sottosistema di 
traduzione (12) opera sulla base di una tabella di 
codici memorizzata in detta memoria di traduzione (11) 

22. Dispositivo secondo la rivendicazione 21 
20 caratterizzato dal fatto che e disposto connesso fra il 

nucleo (14) di detto processore di tipo LX e una 
memoria cache di istruzione (16) di detto processore di 
tipo LX operante su prima memoria (17) contenente 
istruzioni del primo insieme e una seconda memoria 
25 (18) contenente istruzione del secondo insieme e che il 
dispositivo di controllo (13) intercetta gli accessi 
(A1,D1) del nucleo del processore di tipo LX (14) a 
dette memorie (17, 18) . 

23. Dispositivo secondo la rivendicazione 22 
30 caratterizzato dal fatto che comprende un insieme di 

registri puntatori (15) almeno in parte atti a 
controllare l'accesso a dette memorie (17,18). 

24 . Prodotto informatico direttamente caricabile 
nella memoria di un elaboratore numerico e comprendete 

35 porzionx di codice software per attuare il procedimento 



88 



secondo una qualsiasi delle rivendicazioni da 1 a 19 
quando il prodotto e eseguito su un elaboratore. 



RIASSUNTO 

Un procedimento per tradurre istruzioni 
appartenenti a un primo insieme di istruzioni 
eseguibili su un processore di tipo ARM in istruzioni 
5 appartenenti a un secondo insieme di istruzioni 
eseguibili su un processore di tipo LX comprendente un 
nucleo o core, prowede un primo insieme di registri 
corrispondenti alle istruzioni eseguibili su processore 
di tipo ARM e un secondo insieme di registri 
10 corrispondente alle istruzioni eseguibili su processore 
di tipo LX. 

Ciascun registro di detto primo insieme viene 
mappato in un corrispondente registro di detto secondo 
insieme destinato a emularne il comportamento 

15 realizzando una traduzione univoca indipendente dei 
dati di detto primo insieme di istruzioni in detto 
secondo insieme di istruzioni. Detta traduzione e 
attuata tramite un dispositivo di traduzione esterno al 
core del processore di tipo LX, detto core rimanendo 

20 dunque inalterato, in particolare con riferimento alia 
sua issue logic, e la traduzione operando in assenza di 
accesso alle risorse di detto core, tramite 
intercettazione degli accessi del core alia zona di 
memoria riservata alle istruzioni ARM da parte del 

25 dispositivo di traduzione. 

Applicazione pref erenziale in un microprocessore 
ST-200 LX. 

(Figura 1) . 



